Bên cạnh việc sử dụng dữ liệu để đưa ra kế hoạch kinh doanh phù hợp, phân tích dữ liệu còn giúp doanh nghiệp tìm kiếm tệp khách hàng mới, thuận lợi củng cố lợi thế cạnh tranh, bứt phá dẫ
Trang 1KHOA CÔNG NGHỆ PHẦN MỀM
BÁO CÁO THỰC TẬP
DATABASE DEVELOPER
Công ty thực tập : Robert Bosch Engineering and Business Solutions Việt Nam Người phụ trách : Trần Thị Hạnh
TP Hồ Chí Minh, tháng 6 năm 2022
Trang 2Ngày nay, dữ liệu là một trong những yếu tố quan trọng trong kinh doanh vì dữ liệu giúp chúng ta hiểu các vấn đề mà tổ chức đang gặp phải và việc sử dụng dữ liệu hiệu quả sẽ giúp doanh nghiệp cải thiện kết quả kinh doanh, đưa ra chiến lược thị trường tốt hơn, giảm chi phí, giúp doanh nghiệp ra quyết định nhanh và chính xác hơn
Việc phân tích dữ liệu tác động lớn đến đa dạng ngành khác nhau như bán lẻ (Retail), hàng tiêu dùng (Consumer Goods), dịch vụ tài chính (FSI), sản xuất (Manufacturing), bảo hiểm (Insurance)
Lấy thực tế từ việc các nhà bán lẻ có thể quan sát được đầy đủ hành vi, thói quen mua sắm để điều chỉnh hoạt động của doanh nghiệp, từ tiếp thị đến những dịch vụ khách hàng sao cho phù hợp nhất bằng cách thu thập dữ liệu từ nhiều kênh, chẳng hạn như mạng xã hội, nhật ký cuộc gọi, lượt khách hàng ghé thăm, Bên cạnh việc sử dụng dữ liệu để đưa ra kế hoạch kinh doanh phù hợp, phân tích dữ liệu còn giúp doanh nghiệp tìm kiếm tệp khách hàng mới, thuận lợi củng cố lợi thế cạnh tranh, bứt phá dẫn đầu
Sau ba năm rưỡi học tập trên trường, mong muốn có thêm kinh nghiệm thực tế, cũng như muốn được tham gia xử lý dữ liệu, em có dự định là sẽ thực tập trong kì này Vì vậy, em quyết định chọn Robert Bosch RBVH - một môi trường lý tưởng, hiện đại, chuyên nghiệp - là nơi sẽ giúp em thực hiện được dự định này
Trang 3LỜI CẢM ƠN
Trân trọng gửi lời cảm ơn Công ty Robert Bosch RBVN đã tạo điều kiện cho em có cơ hội được thực tập tại công ty
Chỉ trong một thời gian ngắn, nhưng nhờ sự chỉ dẫn nhiệt tình của nhóm trainer, nhóm thực tập chúng em đã tiếp thu được những kiến thức quan trọng để có thể thao tác được trên REDLake Chân thành cảm ơn các anh chị trong nhóm trainer đã bỏ ra nhiều thời gian,công sức
để hướng dẫn chúng em hoàn thành đợt thực tập này
Đặc biệt cảm ơn chị Hạnh, anh Tú đã hướng dẫn, giúp đỡ cho chúng em tận tình những khó khăn việc làm quen với môi trường mới; cảm ơn anh Hùng đã training cho chúng em về cấu trúc của REDLake, cũng như giải đáp những khó khăn, thắc mắc trong quá trình làm việc
Cũng xin cảm ơn thầy cô trong khoa Công nghệ phần mềm đã nhiệt tình hỗ trợ, tạo điều kiện em làm bài báo cáo này
Nam TpHCM, ngày 15 tháng 6 năm 2022
Trang 4NHẬN XÉT CỦA KHOA
Trang 5
Mục lục
CHƯƠNG 1: GIỚI THIỆU CÔNG TY THỰC TẬP 6
1 Giới thiệu công ty RBVH 6
2 Sản phẩm của công ty 6
CHƯƠNG 2: NỘI DUNG THỰC TẬP 7
1 Tìm hiểu công ty và các kỹ năng cơ bản trong công ty 7
2 Nghiên cứu kỹ thuật 7
2.1 Các công cụ làm việc 7
2.2 Tìm hiểu về SQL, PL/SQL 7
2.3 Tìm hiểu về Data Warehouse – Data Lake – Data Modelling 8
2.4 Tìm hiểu về REDLake 9
3 Thực hiện project 10
4 Lịch làm việc 10
CHƯƠNG 3: CHI TIẾT VỀ PROJECT 12
1 Giới thiệu 12
2 Thực hiện 12
3 Kết quả 12
TÀI LIỆU THAM KHẢO 15
Trang 6CHƯƠNG 1: GIỚI THIỆU CÔNG TY THỰC TẬP
1 Giới thiệu công ty RBVH
Công ty TNHH Robert Bosch Engineering and Business Solutions Việt làNam (RBVH) là công ty con 100% thuộc tập toàn Robert Bosch GmbH – một trong những tập đoàn công nghệ hàng đầu thế giới RBVH là một trong những trung tâm phát triển phần mêm đầu tiên của Bosch tại khu vực Đông Nam Á Nơi
2 Sản phẩm của công ty
RBVH là nơi cung cấp giải pháp cho doanh nghiệp trong các lĩnh vực:
- Giải pháp kỹ thuật,
- Giải pháp công nghệ thông tin
- Giải pháp kỹ thuật số
Trang 7CHƯƠNG 2: NỘI DUNG THỰC TẬP
Đợt thực tập với chủ đề “Database Developer” nhằm mục đích giúp sinh viên thực tập được đào tạo toàn diện về Database, đồng thời rèn luyện những kỹ năng mềm như làm việc nhóm, thuyết trình, giao tiếp Tại công ty, sinh viên có cơ hội được học tập, khám phá và làm việc trong một môi trường chuyên nghiệp
1 Tìm hiểu công ty và các kỹ năng cơ bản trong công ty
Thời gian : 1 ngày
Nội dung : Giới thiệu về công ty, cách tổ chức của công ty
Được nghe người phụ trách giới thiệu về công ty, quá trình thành lập và phát triên (như đã nhắc đến ở trên), quy trình làm việc từ cao xuống thấp, cách thức tổ chức của công ty
Ngoài ra, thực tập sinh còn được giới thiệu về cách thức làm việc trong công ty như thời gian đi làm, các quy định cần phải tuân thủ, cách sử dụng email trong công việc…
Kết quả : Hiểu thêm về công ty RBVH, quá trình thành lập và phát triển Có thêm các kỹ
năng về việc sử dụng email trong công việc, làm việc có kế hoạch, có kỷ luật, có trách nhiệm hơn
2 Nghiên cứu kỹ thuật
2.1. Các công cụ làm việc
Thời gian : 4 ngày
Nội dung : Tìm hiểu về các công cụ sẽ được sử dụng trong quá trình làm việc.
Trong thời gian này, supervisor đã hướng dẫn thực tập sinh tìm hiểu về các công
cụ sẽ giúp ích cho trong công việc sau này Một số phần mềm trong số đó như Microsoft Teams, Skype - ứng dụng để trao đổi về công việc cũng như giao tiếp trong công ty, Source Tree – quản lý source code, Notepad ++ -một chương trình soạn thảo văn bản rất hữu ích và phổ biến với lập trình viên
Thực hiện : Thực hành sử dụng các phần mềm đã nêu trên.
Kết quả : Lập trình sử dụng các công cụ miễn phí, giúp dễ dàng kết hợp các công cụ
với nhau, so với việc dung các IDE
2.2. Tìm hiểu về SQL, PL/SQL
Nội dung : Được training về SQL và PL/SQL, những kiến thức quan trọng trong
PL/SQL
- Composite Datatypes:
Các kiến thức cơ bản về Records, Nested Tables, Varrays, Associative Arrays
- Cursor:
Trang 8- Trigger:
Thực tập sinh được dướng dẫn về việc hiện thực và sử dụng Triggers, đây là một trong những phần rất quan trọng khi làm việc trên database, vì cần đảm bảo tính đúng đắn của dữ liệu trong relational database
- Procedures/ Functions:
Cung cấp cách tạo ra các procedures, functions và cách gọi chúng Bên cạnh đó là những điểm tương đồng và khác biệt giữa procedures và functions, hiểu thêm về một số thành phần parameter và return phổ biến được sử dụng trong các chương trình con PL/SQL
- Package:
Cách hiện thực và trường hợp sử dụng package, lợi ích của package
Thực hiện :
- Tham gia đầy đủ các buổi training của công ty
- Làm các bài thực hành, kiểm tra về kiến thức đã học
Kết quả :
- Ôn lại các kiến thức về SQL
- Biết thêm những định nghĩa, kiến thức mới về PL/SQL
- Ngoài ra còn được biết thêm một số quy tắc trong việc viết code sao cho đúng chuẩn, dễ đọc, dễ hiểu
2.3. Tìm hiểu về Data Warehouse – Data Lake – Data Modelling
Nội dung: Các kiến thức cơ bản về Data Warehouse, Data Lake, Data Modelling
- Data warehouse architecture:
Nắm được các loại kiến trúc cơ bản có trong Data warehouse như centralized, component-based, cùng với đó là ưu, nhược điểm của từng loại để ứng dụng trong từng trường hợp cụ thể
- Data Integration:
Hiểu được khái niệm cơ bản của Data Integration, biết được các tools được sử dụng cho từng loại source systems cụ thể Hiểu được các khái niệm quan trọng bao gồm ETL, ELT
- Data Mart:
Trang 9- Data Lake
Phân biệt sự khác nhau giữa Data Lake và Data Warehouse, cấu trúc cơ bản của Data Lake, những điều cần tránh khi thiết kế Data Lake để Data Lake không trở thành Data Swamp
- Business Intelligence
Nắm được vai trò quan trọng của Business Intelligence, các quy trình trong Business Intelligence system
- Dimensional Model
Hiểu rõ các thành phần trong dimensional model (fact table, dimension table) Ngoài ra, phân biệt được các loại cấu trúc của dimensional model (star schema, snowflake schema)
- Data Vault Modelling
Nắm được các loại table cơ bản trong Data Vault Modelling như HUB, LINK, SATELLITE Ngoài ra, biết thêm về các loại bảng nâng cao hơn như Point-In_time, Bridge
Thực hiện :
- Tham gia đầy đủ các buổi trainning
- Tìm kiếm tài liệu trên mạng để tìm hiểu thêm
Kết quả :
- Hiểu được những khái niệm cơ bản liên quan đến Data Lake, Data Warehouse, Data Modeling
2.4. Tìm hiểu về REDLake
Nội dung : Khái niệm cơ bản trong REDLake, cấu trúc cũng như các thành phần bên
trong REDLake
- Định nghĩa về REDLake:
Robert Bosch Enterprise Data Lake là một nền tảng dữ liệu trung tâm với tệp khách hàng là doanh nghiệp REDLake có thể phân tích bất kỳ loại dữ liệu nào từ
Trang 10tảng kỹ thuật và một khuôn khổ (các khái niệm tích hợp)
- Cấu trúc của REDLake:
REDLake là sự kết hợp giữa Data Warehouse và Data Lake, nắm rõ được các tầng trong REDLake, các quy tắc làm việc trên REDLake
Thực hiện :
- Tham gia đầy đủ các buổi training
- Thực hiện một số task mô phỏng trên hệ thống REDLake
Kết quả:
- Đã có thể hiểu được cơ bản cấu trúc của REDLake
3 Thực hiện project
Sau khi được training và thực hành, thực tập sinh đã nắm được những kiến thực cơ bản
về PL/SQL, Data Warehouse, Data Modeling, REDLake Trong tháng thứ ba, trainer đã hướng dẫn thực tập sinh áp dụng những kiến thức đã học để thực hiện thực hiện một số tasks trên REDLake
Chi tiết sẽ được nói ở phần sau
4. Lịch làm việc
Mức độ hoàn thành
Nhận xét của người hướng dẫn
1
- Tìm hiểu về công ty, cách
tổ chức của công ty
- Làm quen với các công cụ làm việc trong công ty
- Học cách trao đổi, làm việc qua email
Chị Trần Thị Hạnh
2
- Tham gia chuỗi training của công ty về SQL
- Thực hành các bài tập liên quan
Anh Lâm Quốc Vinh
Anh Ngô Mạnh Duy
Anh Huỳnh Quốc Hùng
Anh Đinh Ngọc Hạ
Trang 11- Thực hành các bài tập liên
Anh Huỳnh Quốc Hùng
Anh Đinh Ngọc Hạ Long
4 Tìm hiểu về các khái niệm
trong Data Warehouse
Anh Huỳnh Quốc Hùng
5 Tìm hiểu về Data Modeling:Data Vault Modeling,
Dimensional Modeling
Anh Huỳnh Quốc Hùng
6 Tìm hiểu về cấu trúc cơ bảncủa REDLake Anh Huỳnh QuốcHùng
7
Tìm hiểu về quy tắc làm việc, cách làm việc trên REDLake
Anh Huỳnh Quốc Hùng
8 Thực hiện một số task trênREDLake Anh Huỳnh QuốcHùng
Trang 12CHƯƠNG 3: CHI TIẾT VỀ PROJECT
1 Giới thiệu
- Là một task thật để làm quen với REDLake
- Tự tìm hiểu tài liệu
2 Thực hiện
- Làm theo cá nhân dưới sự giám sát của mentor
- Dựa theo tài liệu được cung cấp để thực hiện đúng kết quả được giao
3 Kết quả
- Hoàn thành yêu cầu được giao trước kỳ hạn quy định
Trang 14TÀI LIỆU THAM KHẢO
[1] REDLake:
https://inside-docupedia.bosch.com/confluence/display/DAAS/
Data+as+a+Service+Home
[2] https://bosch-etm.udemy.com/course/data-warehouse-fundamentals-for-beginners
[3] Building a scalable data warehouse with data vault 2.0, author: Daniel Linstedt, Michael Olschimke
Trang 15TỔNG KẾT
Như vậy, chỉ trong vòng ba tháng ngắn ngủi, em đã có thể thực hiện các tasks trong REDLake
Chân thành cảm ơn sự giúp đỡ của các anh chị nhóm trainer Cảm ơn thầy Lê Thanh Trọng đã giúp em hoàn thành bài báo cáo này