Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao - Phát sinh soSao kiểu dữ liệu int o Chọn Min = 1 và Max = 5 o Mục Distribution chọn Random thì dữ liệu sẽ được sinh ra tự
Trang 1Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
BÁO CÁO CÁCH PHÁT SINH DỮ LIỆU LỚN
Phần mềm sử dụng : SQL Data Generation 4 - RedGate
Cơ sở dữ liệu : iVivu
Sinh viên thực hiện :
Trang 3Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Sau khi tạo Project thành công sẽ hiển thị giao diện bên dưới
Trang 4- Ở đây chúng ta có tất cả 7 bảng dữ liệu , việc tiếp theo cần làm là chỉ định
dữ liệu cho từng bảng
1 Phát sinh dữ liệu cho bảng Khách hàng , ở phần Number of rows to
generator -> Specify number of rows by , ta chọn Numberic value :
5,000,000 dòng
Trang 5Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
Trang 6- Phát sinh maKH ( int ) là khóa chính , là duy nhất và tự động tăng nên ta để mặc định
- Phát sinh hoTen ( kiểu dữ liệu nvarchar) : 2 cách
o Cách thứ 1 là điền vào ô Regular Expression
Cú pháp : Dấu ngoặc ( để mở đầu và ) để kết thúc , thay đổi bằng dấu |
o Cách thứ 2 là Insert File List
Tạo 3 file txt như hình dưới và copy vào thư mục cấu hình của phần mềm , lưu ý chọn định dạng UTF-8 khi lưu nếu không sẽ
bị lỗi
Trang 7Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
Tiếp theo chọn Insert File List
Trang 8 Chọn file cần thêm vào , ở đây ta chọn First Name , Last Name
và Middle Name
Kết quả sau khi thực hiện
Trang 9Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh tenDangNhap ( kiểu dữ liệu nvarchar)
o Cú pháp Regular Expression :
KH[01234][0123456789][0123456789][0123456789][0123456789][0123456789][0123456789]
Trang 10- Phát sinh matKhau ( kiểu dữ liệu nvarchar)
o Cú pháp Regular Expression :
[123456][abcxyz][123456][abcxyz][123456][abcxyz][123456][abcxyz][123456]
Trang 11Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh soCMND ( 9 số , kiểu dữ liệu nvarchar)
o Cú pháp Regular Expression :
[0123456789][0123456789][0123456789][0123456789][0123456789][0123456789][0123456789][0123456789][0123456789]
Trang 12- Phát sinh diaChi ( kiểu dữ liệu nvarchar)
o Cú pháp Regular Expression :
([0123456789]|10|11|12|13|14|15|16|17|20|22|25|644|456) (Hàng Trống|Trần Hưng Đạo|Hai Bà Trưng| Trần Quý Cáp | Lê Hồng
Phong|Nguyễn Trãi | Nguyễn Huệ | Hùng Vương|CMT8|Thành
Thái|Nguyễn Văn Cừ|) , (Quận 1|Quận 2|Quận 3|Quận 4|Quận 5|Quận 6|Quận 7|Quận 8 |Quận 9|Quận 10) , (HCM|Đà Nẵng|Hà Nội|Cần Thơ|Nha Trang|Hải Phòng)
Trang 13Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh dienThoai ( kiểu dữ liệu nvarchar)
o Cú pháp Regular Expresstion :
(0|\+84 ?)[1-9][0-9][0-9] [0-9][0-9][0-9] [0-9][0-9][0-9]
Trang 14- Phát sinh moTa ( kiểu dữ liệu nvarchar)
Trang 15Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
2 Phát sinh dữ liệu cho bảng Khách sạn , ở phần Number of rows to
generator -> Specify number of rows by , ta chọn Numberic value : 100 dòng
Trang 16- Phát sinh maKS ( kiểu dữ liệu int )là khóa chính , là duy nhất và tự động
Trang 17Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh soSao ( kiểu dữ liệu int )
o Chọn Min = 1 và Max = 5
o Mục Distribution chọn Random thì dữ liệu sẽ được sinh ra tự động , còn nếu ta chọn Sequential thì dữ liệu sẽ tăng theo giá trị ta nhập vào
Trang 18- Phát sinh duong ( kiểu dữ liệu nvarchar)
o Cú pháp Regular Expression:
(Hàng Trống|Trần Hưng Đạo|Hai Bà Trưng| Trần Quý Cáp | Lê Hồng Phong|Nguyễn Trãi | Nguyễn Huệ | Hùng Vương|CMT8|Thành Thái|Nguyễn Văn Cừ|)
Trang 19Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh quan ( kiểu dữ liệu nvarchar )
o Cú pháp Regular Expression:
([123456789]|Hai Bà Trưng|Bình Thạnh|Bình Tân|Phú Nhuận|Hoàn Kiếm)
Trang 20- Phát sinh thanhPho ( kiểu dữ liệu nvarchar )
o Cú pháp Regular Expression :
HCM|Hà Nội|Cần Thơ|Đà Nẵng|Nha Trang|Hải Phòng
Trang 21Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh giaTB ( kiểu dữ liệu float )
o Ta chọn Min = 150,000 và Max = 400,000 hoặc số khác tùy nhu cầu
- Phát sinh dữ liệu moTa ( kiểu dữ liệu nvarchar)
o Cú pháp Regular Expression :
Đẹp|Thoáng mát|Sang trọng|Tệ|Quá tệ
Trang 223 Phát sinh dữ liệu cho bảng Loại phòng , ở phần Number of rows to
generator -> Specify number of rows by , ta chọn Numberic value : 2000 dòng
Trang 23Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh maLoaiPhong ( int ) là khóa chính ,tự động tăng và duy nhất nên
Trang 24- Phát sinh maKS ( kiểu dữ liệu int ) là khóa ngoại tham chiếu đến bảng Khách Sạn
- Trong mục Population Method , ở đây chúng ta có 3 sự chọn :
o All key values unique : Tất cả dữ liệu tham chiếu đều là duy nhất
o Repeat key values between … and … : lập lại dữ liệu ở giữa 2 giá trị
o Repeat key values at random : lập lại dữ liệu một cách tự động
Trang 25Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh moTa ( kiểu dữ liệu nvarchar )
o Cú pháp Regular Expression :
Tốt|Chất lượng|Thoáng mát|Đẹp
Trang 26- Phát sinh donGia ( kiểu dữ liệu float )
o Ta chọn min = 150,000 và max = 400,000 hoặc số khác tùy nhu cầu
- Phát sinh slTrong ( kiểu dữ liệu int )
o Ta chọn Min = 0 và Max = 100 hoặc số khác tùy nhu cầu
Trang 27Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
4 Phát sinh dữ liệu cho bảng Phòng , ở phần Number of rows to generator ->
Specify number of rows by , ta chọn Numberic value : 30.000.000 dòng
Trang 28- Phát sinh maPhong ( int ) là khóa chính , tự động tăng và duy nhất nên ta để mặc định
- Phát sinh maLoaiPhong (int) là khóa ngoại tham chiếu đến bảng Loại Phòng
- Trong mục Population Method , ở đây chúng ta có 3 sự chọn :
o All key values unique : Tất cả dữ liệu tham chiếu đều là duy nhất
o Repeat key values between … and … : lập lại dữ liệu ở giữa 2 giá trị
o Repeat key values at random : lập lại dữ liệu một cách tự động
- Phát sinh soPhong ( kiểu dữ liệu int )
o Ta chọn Min = 1 và Max = 300 hoặc số khác theo nhu cầu
Trang 29Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
5 Phát sinh dữ liệu cho bảng Tình trạng , ở phần Number of rows to
generator -> Specify number of rows by , ta chọn Numberic value :
1.000.000 dòng
Trang 30- Phát sinh maPhong ( int ) là khóa chính và là khóa ngoại tham chiếu đến
bảng Phòng
- Trong mục Population Method , ở đây chúng ta có 3 sự chọn :
o All key values unique : Tất cả dữ liệu tham chiếu đều là duy nhất
o Repeat key values between … and … : lập lại dữ liệu ở giữa 2 giá trị
o Repeat key values at random : lập lại dữ liệu một cách tự động
Trang 31Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh ngay ( kiểu dữ liệu datetime)
o Ta chọn Min date và Max date theo nhu cầu nhưng lưu ý Maxdate phải lớn hơn Mindate
o Ở phần Distribution : ta chọn random thì dữ liệu sẽ sinh ra một cách
tự động , còn chọn Sequential thì dữ liệu sẽ tăng theo giá trị ta nhập vào
Trang 32- Phát sinh tinhTrang ( kiểu dữ liệu int )
o Ta chọn Min = 0 ( phòng trống ) và Max = 1 ( phòng đã có người )
Trang 33Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
6 Phát sinh dữ liệu cho bảng Đặt phòng , ở phần Number of rows to
generator -> Specify number of rows by , ta chọn Numberic value :
6.000.000 dòng
- Phát sinh maDP ( int ) là khóa chính , tự động tăng và duy nhất nên ta để mặc định
- Phát sinh maLoaiPhong ( int ) là khóa ngoại tham chiếu đến bảng LoaiPhong
- Trong mục Population Method , ở đây chúng ta có 3 sự chọn :
o All key values unique : Tất cả dữ liệu tham chiếu đều là duy nhất
o Repeat key values between … and … : lập lại dữ liệu ở giữa 2 giá trị
o Repeat key values at random : lập lại dữ liệu một cách tự động
- Phát sinh maKhachHang ( int ) là khóa ngoại tham chiếu đến bảng Khách Hàng
- Trong mục Population Method , ở đây chúng ta có 3 sự chọn :
o All key values unique : Tất cả dữ liệu tham chiếu đều là duy nhất
o Repeat key values between … and … : lập lại dữ liệu ở giữa 2 giá trị
o Repeat key values at random : lập lại dữ liệu một cách tự động
Trang 34- Phát sinh ngayBD ( kiểu dữ liệu datetime )
o Ta chọn Mindate và Maxdate theo nhu cầu nhưng lưu ý Max day phải lớn hơn Mindate
o Ở phần Distribution : ta chọn random thì dữ liệu sẽ sinh ra một cách
tự động , còn chọn Sequential thì dữ liệu sẽ tăng theo giá trị ta nhập vào
Trang 35Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh ngayTP ( datetime )
o Ta chọn Mindate và Maxdate theo nhu cầu nhưng lưu ý Max day phải lớn hơn Mindate Ngày trả phòng phải sau ngày ngày bắt đầu
o Ở phần Distribution : ta chọn random thì dữ liệu sẽ sinh ra một cách
tự động , còn chọn Sequential thì dữ liệu sẽ tăng theo giá trị ta nhập vào
Trang 36- Phát sinh ngayDat(date time ) tương tự
Trang 37Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh donGia ( kiểu dữ liệu float )
o Ta chọn Min = 150,000 và Max = 400,000 hoặc số khác tùy nhu cầu
o Ở phần Distribution : ta chọn random thì dữ liệu sẽ sinh ra một cách
tự động , còn chọn Sequential thì dữ liệu sẽ tăng theo giá trị ta nhập vào
- Phát sinh moTa ( kiểu dữ liệu nvarchar )
o Cú pháp Regular Expresstion : ( tùy chọn )
Khách trả trước 50%|Khách tính tiền sau
Trang 38- Phát sinh tinhTrang ( int )
o Ta chọn Min = 0 ( phòng trống ) và Max = 1 ( phòng đã có người )
Trang 39Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
7 Phát sinh dữ liệu cho bảng Hóa đơn , ở phần Number of rows to generator
-> Specify number of rows by , ta chọn Numberic value : 5.000.000 dòng
- Phát sinh maHD ( int ) là khóa chính , tự động tăng và duy nhất nên ta để mặc định
- Phát sinh ngayThanhToan ( datetime)
o Ta chọn Mindate và Maxdate theo nhu cầu nhưng lưu ý Max day phải lớn hơn Mindate Ngày trả phòng phải sau ngày ngày bắt đầu
o Ở phần Distribution : ta chọn random thì dữ liệu sẽ sinh ra một cách
tự động , còn chọn Sequential thì dữ liệu sẽ tăng theo giá trị ta nhập vào
Trang 40- Phát sinh tongTien ( kiểu dữ liệu float )
o Ta chọn Min và Max theo nhu cầu
o Ở phần Distribution : ta chọn random thì dữ liệu sẽ sinh ra một cách
tự động , còn chọn Sequential thì dữ liệu sẽ tăng theo giá trị ta nhập vào
Trang 41Trường Đại học khoa học tự nhiên TPHCM Cơ sở dữ liệu nâng cao
- Phát sinh maDP ( int ) là khóa ngoại tham chiếu đến bảng DatPhong
o Ở phần Distribution : ta chọn random thì dữ liệu sẽ sinh ra một cách
tự động , còn chọn Sequential thì dữ liệu sẽ tăng theo giá trị ta nhập vào