- Các phương thức thuộc statistics: Một số phương thức tính giá trị trung bình hoặc giá trị điểnhình từ một tập hợp hoặc mẫu như là: mean, fmean,median, median_low, median_high, mode,
Trang 1TIỂU LUẬN GIỮA KÌ
Trang 2TIỂU LUẬN GIỮA KÌ
Trang 3đã hướng dẫn để em hoàn thành tiểu luận này Trong thời gian nửa đầu của môn họcnay thầy và cô đã cho em thêm nhiều kiến thức bổ ích và vận dụng chúng vào bàitiểu luận này.
Bài tiểu luận này là sự kết hợp của những kiến thức và nỗ lực của em trongthời gian học vừa qua Do chưa có nhiều kinh nghiệm làm tiểu luận cũng như kiếnthức còn hạn chế, bài tiểu luận sẽ không tránh khỏi những thiếu sót Rất mong nhậnđược sự giúp đỡ từ quý thầy cô để em có thể hoàn thiện hơn
Xin chân thành cảm ơn!
Trang 4NỘI DUNG BÁO CÁO 1
Phần 1: Thư viện thống kê bằng Python 1
Trang 5sử dụng rộng rãi nhất:
Python’s statistics là một thư viện Python tích hợp cho các
thống kê mô tả Có thể sử dụng nó nếu bộ dữ liệu không quálớn hoặc nếu không thể dựa vào việc nhập các thư viện khác
staticstics: Mô-đun này cung cấp các chức năng để tính toán
thống kê toán học của Real dữ liệu số (-valued) Mô-đun nàykhông nhằm mục đích trở thành đối thủ cạnh tranh với các thưviện của bên thứ ba như NumPy , SciPy hoặc các gói thống kêđầy đủ tính năng độc quyền nhằm vào các nhà thống kê chuyênnghiệp như Minitab, SAS và Matlab Nó hướng đến trình độ vẽ
đồ thị và máy tính khoa học
- Các phương thức thuộc statistics:
Một số phương thức tính giá trị trung bình hoặc giá trị điểnhình từ một tập hợp hoặc mẫu như là: mean(), fmean(),median(), median_low(), median_high(), mode(), mutimode(),quantiles(), …
Một số phương thức tính toán một thước đo về mức độ mà tổngthể hoặc mẫu có xu hướng lệch khỏi các giá trị điển hình hoặctrung bình như là: pstdev(), pvariance(), stdev(), variance()
Một số phương thức tính toán số liệu thống kê liên quan đếnquan hệ giữa hai đầu vào như là: covariance() , correlation(),linear_regression()
Trang 6- Ví dụ:
1.2.2 Hàm fmean():
- Được sử dụng để tính giá trị trung bình thực của các giá trị đầuvào Nó chuyển đổi dữ liệu đầu vào thành các giá trị float vàtính giá trị trung bình số học
- Ví dụ:
Trang 71.2.3 Hàm geometric_mean():
- Được sử dụng để tính giá trị trung bình thực của các giá trị đầuvào Nó chuyển đổi dữ liệu đầu vào thành các giá trị float vàtính giá trị trung bình hình học
- Ví dụ:
Trang 8- Trả về giá trị trung bình hài hòa của dữ liệu đã cho Lưu ý nếu
dữ liệu rỗng thì sẽ xuất hiện lỗi StatisticsError
- Ví dụ:
Trang 91.2.5 Hàm median():
- Được sử dụng tính giá trị trung vị (giá trị giữa) của tập dữ liệu
đã cho Phương pháp này cũng sắp xếp dữ liệu theo thứ tự tăngdần trước khi tính giá trị trung bình
Trang 101.2.6 Hàm median_low():
- Được sử dụng tính giá trị trung bình thấp của tập dữ liệu đãcho Phương pháp này cũng sắp xếp dữ liệu theo thứ tự tăngdần trước khi tính giá trị trung vị thấp
- Cách sử dụng: statistics.median_high(data)
Trang 11vị trí của các giá trị từ tập dữ liệu rơi vào đó trong phạm vi đó.
- Dữ liệu đầu vào đối với data có thể là bất kĩ chuỗi, danh sáchhoặc iterator nào còn đối với iterval không bắt buộc nhưng
Trang 12khoảng thời gian đối số tùy chọn biểu thị khoảng thời gian lớp
và mặc định thành 1
- Trả về giá trị trung bình của dữ liệu liên tục được nhóm lại,được tính bằng phần trăm thứ 50 Lưu ý nếu dữ liệu rỗng thì sẽxuất hiện lỗi StatistcsError
- Ví dụ:
- statistics.mode(data):
- Được sử dụng tính toán chế độ (xu hướng trung tâm) của tập
dữ liệu số hoặc danh nghĩa đã cho
- Dữ liệu đầu vào đối với data có thể là bất kĩ chuỗi, danh sáchhoặc iterator nào
- Trả về điểm dữ liệu phổ biến nhất từ dữ liệu rời rạc hoặc danhnghĩa Chế độ (khi nó tồn tại) là giá trị điển hình nhất và đóngvai trò là thước đo vị trí trung tâm
- Nếu có nhiều chế độ có cùng tần số, hãy trả về phương thứcđầu tiên gặp trong dữ liệu Lưu ý nếu dữ liệu rỗng thì sẽ xuấthiện lỗi StatistcsError
- Ví dụ:
Trang 14- Dữ liệu đầu vào gồm có 3 tham số đó là data (chứa dữ liệu màbạn muốn có được các lượng tử, không được rỗng), n (số lượnglượng tử bạn muốn Tham số này có một giá trị số nguyên, là 4theo mặc định, đây là tùy chọn), method (phương pháp mà cáclượng tử sẽ được tính toán).
- Trả về một danh sách chứa các giá trị số của các lượng tử n-1trên
- Trả về giá trị float đại diện cho độ lệch chuẩn dân số của một
dữ liệu nhất định Lưu ý nếu dữ liệu rỗng thì sẽ xuất hiện lỗiStatistcsError
- Ví dụ:
Trang 15số học được tự động tính toán).
- Trả về một giá trị float đại diện cho phương sai dân số củamột dữ liệu nhất định Lưu ý nếu dữ liệu rỗng thì sẽ xuất hiệnlỗi StatistcsError
- Ví dụ:
Trang 16số học được tự động tính toán).
- Trả về một giá trị float đại diện cho độ lệch chuẩn của một dữliệu nhất định Lưu ý nếu dữ liệu rỗng hoặc có ít hơn hai giátrị thì sẽ xuất hiện lỗi StatistcsError
- Ví dụ:
1 Hàm variance():
- Được sử dụng để trả về phương sai của một mẫu dữ liệu đãcho
Trang 17số học được tự động tính toán).
- Trả về một giá trị float đại diện cho phương sai dữ liệu nhấtđịnh Lưu ý nếu dữ liệu rỗng hoặc có ít hơn hai giá trị thì sẽxuất hiện lỗi StatistcsError
- Dữ liệu đầu vào gồm x (tham số thứ nhất), y (tham số thứ hai)
- Trả về hiệp phương sai của hai đầu vào x và y Cả hai đầu vào phải
có cùng độ dài (không dưới hai), nếu không thì lỗi StatisticerRrorxuất hiện
- Ví dụ:
Trang 18- Hàm correlation(x, y, /):
- Được sử dụng tìm hệ số tương quan của Pearson giữa hai đầu vào
- Cách sử dụng: statistics.correlation(x,y,/)
- Dữ liệu đầu vào gồm x (tham số thứ nhất), y (tham số thứ hai)
- Trả về hệ số tương quan của Pearson cho hai đầu vào Hệ số tương quancủa Pearson R có các giá trị giữa -1 đến +1 Cả hai đầu vào phải có cùng
độ dài (không dưới hai) và không cần phải không đổi, nếu không thì lỗiStatisticsError xuất hiện
Trang 20Phần 2: Histogram equalization algorithm (Thuật toán cân
bằng biểu đồ)
2.1 Khái niệm
- Trong lĩnh vực xử lí ảnh, histogram là biểu đồ tần xuất được dùng đểthống kê số lần xuất hiện các mức sáng trong ảnh
- Cân bằng histogram (histogram equalization) là sự điều chỉnh histogram
về trạng thái cân bằng, làm cho phân bố (distribution) giá trị pixel không
bị co cụm tại một khoảng hẹp mà được "kéo dãn" ra
- Các bước để cân bằng biểu đồ trong Histogram eualization algorithm:
Thống kê pixel cho từng mức sáng cho ảnh ta đượchistogram H(i)
- Trong thư viện OpenCV có một hàm hỗ trợ trực tiếp để đó là
equalizeHist().
- Kết quả sau khi cân bằng sẽ nhận lại được ảnh có mức độ tương phản cao
Trang 21X quang Làm như vậy sẽ giúp các bác sĩ và chuyên gia X quanggiải thích tốt hơn các hình ảnh quét và đưa ra chẩn đoán chínhxác.
2.2 Ví dụ về Histogram equalization algorithm
- Sau đây là hình ảnh minh họa ảnh và biểu đồ trước khi ta dùng thuật toán đểcân bằng:
- Nhìn vào biểu đồ ta thấy được các giá trị pixel (trục ngang) đều nằm trongkhoảng [150, 200] Điều đó khiến cho toàn bộ ảnh bị sáng hơn mức cần thiết,
độ tương phản không cao, không rõ nét
- Sau đây là hình ảnh và biểu đồ khi đã dùng thuật toán để cân bằng:
Trang 22- Nhìn vào biểu đồ và ảnh ta sẽ thấy được giá trị của pixel trải dài trongkhoảng [0,255] làm cho ảnh có độ tương phản cao hơn Đó là kết quả củaviệc sử dụng thuật toán Histogram equalization.
Trang 23- Tạo ra biểu đồ và ảnh mới sau khi cân bằng.
3.2 My code:
Trang 243.3 Kết quả:
- Ảnh gốc:
- Biểu đồ ảnh gốc:
Trang 25- Biểu đồ ảnh mới:
Trang 26TÀI LIỆU THAM KHẢO
4. https://www.geeksforgeeks.org/matplotlib-tutorial/