Aggregation trong MongoDB Aggregation có thể hiểu là sự tập hợp.. Các Aggregation operation xử lý các bản ghi dữ liệu và trả về kết quả đã được tính toán.. Các phép toán tập hợp nhóm cá
Trang 1Aggregation trong MongoDB
Aggregation có thể hiểu là sự tập hợp Các Aggregation operation xử lý các bản ghi dữ
liệu và trả về kết quả đã được tính toán Các phép toán tập hợp nhóm các giá trị từ nhiều Document lại với nhau, và có thể thực hiện nhiều phép toán đa dạng trên dữ liệu đã được nhóm đó để trả về một kết quả duy nhất Trong SQL, count(*) và GROUP BY là tương đương với Aggregation trong MongoDB
Phương thức aggregate() trong MongoDB
Với Aggregation trong MongoDB, bạn nên sử dụng phương thức aggregate()
Cú pháp
Cú pháp cơ bản của phương thức aggregate() là như sau:
> db COLLECTION_NAME aggregate ( AGGREGATE_OPERATION )
Ví dụ
Trong Collection, bạn có dữ liệu sau:
{ _id : ObjectId ( 7df78ad8902c ) title : 'MongoDB Overview' , description :
'MongoDB is no sql database' , by_user : 'tutorials point' , url :
'http://www.tutorialspoint.com' , tags : [ 'mongodb' , 'database' , 'NoSQL' ], likes : 100 }, _id : ObjectId ( 7df78ad8902d ) title : 'NoSQL Overview' , description : 'No sql database is very fast' , by_user : 'tutorials point' , url : 'http://www.tutorialspoint.com' , tags : [ 'mongodb' , 'database' ,
'NoSQL' ], likes : 10 }, _id : ObjectId ( 7df78ad8902e ) title : 'Neo4j Overview' , description : 'Neo4j is no sql database' , by_user : 'Neo4j' , url : 'http://www.neo4j.com' , tags : [ 'neo4j' , 'database' , 'NoSQL' ], likes :
750 },
Từ Collection trên, nếu bạn muốn hiển thị một danh sách có bao nhiêu bài hướng dẫn
được viết bởi mỗi người dùng, thì bạn sẽ sử dụng phương thức aggregate() như sau:
> db mycol aggregate ([{ $group : { _id : "$by_user" , num_tutorial : { $sum :
1 }}}]) "result" { "_id" "tutorials point" ,
"num_tutorial" }, { "_id" "Neo4j" ,
"num_tutorial" } ], "ok"
Truy vấn SQL tương đương cho trường hợp trên là select by_user, count(*) from mycol group by by_user
Trang 2Trong ví dụ trên, chúng ta đã nhóm các Document bởi trường by_user và trên mỗi lần xuất
hiện của by_user, giá trị trước đó của tổng sẽ được tăng lên Có một danh sách các biểu thức Aggregation có sẵn, được liệt kê dưới đây:
trong Collection đó
db.mycol.aggregate([{$group : {_id : "$by_user",
num_tutorial : {$sum :
"$likes"}}}])
$avg Tính trung bình của tất cả giá trị đã cho từ tất cả
Document trong Collection đó
db.mycol.aggregate([{$group : {_id : "$by_user",
num_tutorial : {$avg :
"$likes"}}}])
$min Lấy giá trị nhỏ nhất của các giá trị từ tất cả
Document trong Collection đó
db.mycol.aggregate([{$group : {_id : "$by_user",
num_tutorial : {$min :
"$likes"}}}])
$max Lấy giá trị lớn nhất của các giá trị từ tất cả
Document trong Collection đó
db.mycol.aggregate([{$group : {_id : "$by_user",
num_tutorial : {$max :
"$likes"}}}])
kết quả
db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet Chèn giá trị tới một mảng trong Document kết
quả, nhưng không tạo các bản sao
db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
theo nhóm
db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
: {_id : "$by_user", last_url :
Trang 3theo nhóm {$last : "$url"}}}])
Khái niệm pipeline trong MongoDB
Trong UNIX, lệnh shell pipeline nghĩa là khả năng để thực thi một hoạt động trên một số input và sử dụng output như là input cho lệnh tiếp theo, và … MongoDB cũng hỗ trợ cùng khái niệm pipeline đó trong Aggregation Framework Có một tập hợp các giai đoạn có thể
có và mỗi giai đoạn đó lấy một tập hợp các Document như là một input và tạo ra một tập các Document kết quả (hoặc kết quả cuối cùng JSON Document tại phần cuối của pipeline) Kết quả này, sau đó, sẽ lại được sử dụng cho giai đoạn tiếp theo …
Các giai đoạn có thể có trong Aggregation Framework là:
• $project: Được sử dụng để chọn một số trường cụ thể từ một Collection
• $match: Đây là một hoạt động lọc và vì thế nó có thể giảm số Document mà được
cung cấp như là input cho giai đoạn kế tiếp
• $group: Thực hiện Aggregation thực sự, như đã trình bày ở trên
• $sort: Sắp xếp các Document
• $skip: Nhảy qua số Document đã cung cấp
• $limit: Giới hạn số Document
• $unwind: Được sử dụng để chia một Document đang sử dụng mảng thành nhiều
Document Sử dụng hoạt động này sẽ tạo một số lượng Document cho bước tiếp theo