Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Add "beam search" #1783

Merged
merged 3 commits into from Jun 16, 2020
Merged

Add "beam search" #1783

merged 3 commits into from Jun 16, 2020

Conversation

davidnvq
Copy link
Contributor

Hồi xưa học trong giáo trình thì thuật ngữ này được dịch là "tìm kiếm beam", và cũng thấy khá nhiều bài giảng, bài viết và giáo trình sử dụng dựa trên kết quả tìm kiếm Google. Thấy có hai phần các bạn dịch là tìm kiếm chùm tia thấy hơi sao sao? Mọi ng thảo luận xem nên giữ nguyên hay dịch chữ beam.

glossary.md Outdated
@@ -50,6 +50,7 @@ Nếu bạn cho rằng một từ không nên dịch ra tiếng Việt, bạn c
| Blackbox dev set | tập phát triển Blackbox | [https://git.io/JvQx3](https://git.io/JvQx3) |
| bounding box | khung chứa | [https://git.io/JvQxs](https://git.io/JvQxs) |
| broadcast | lan truyền | [https://git.io/Jvoj3](https://git.io/Jvoj3) |
| beam search | tìm kiếm beam | |
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

mình vừa thấy ở sách MLY cũng dịch là tìm kiếm chùm tia
image

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Vậy hả, sách đấy cũng AIVN mình dịch mà :)) Nhưng mình thấy giáo trình học thuật họ đã dịch sẵn là tìm kiếm beam thì nên giữ nguyên. Anw, đây là cơ hội để thảo luận thêm về từ này (có thể lần trc chưa thảo luận kĩ).
PS: Chùm tia nghe vật lý quá mà không thể hiện rõ bản chất lắm.

Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

ừm mình vừa search thì cũng chỉ có 1 2 chỗ dịch là chùm, còn hầu hết giáo trình dịch là tìm kiếm beam

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Yeah, Phần @nguyenduydu dịch thì sử dụng từ này. Đợi xem ý kiến mn thế nào rồi chúng ta thống nhất từ này cho nhất quán ;)

Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

@davidnvq anh vui lòng kèm thêm reference được không ạ?

Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

@davidnvq nếu ông giáo không còn phản biện thì mình chốt từ này. Chờ ông giáo thêm 1 hôm nữa nhé.

Copy link
Contributor Author

@davidnvq davidnvq Jun 16, 2020

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

�Thanks cả nhà đã discuss sôi nổi :3 bây giờ mới onl được. Mình vẫn ủng hộ tìm kiếm beam

Không phải bắt bẻ gì nhưng mình search trên google.com.vn tìm kiếm beam thì trên trang nhất chỉ có duy nhất một kết quả tiếng việt là trang này (https://voer.edu.vn/m/cac-chien-luoc-tim-kiem-kinh-nghiem/d478b017).

Sorry lỗi này là ở mình dù có đưa nguồn sách kia nhưng chắc mọi người search k ra do thiếu từ khoá "tìm kiếm beam trí tuệ nhân tạo" trong link trl em Vinh.
Mình vote từ "tìm kiếm beam" bởi vì mình nhớ đã gặp nó trong giáo trình TTNT (Nguyễn Thanh Thuỷ) mà mình được học, khá tiếc là k tìm thấy bản mềm trên mạng của cuốn sách đó.

Mình xin phép trích dẫn lại từng giáo trình hoặc tài liệu khác mà available sẵn từ GG:

http://ccs1.hnue.edu.vn/hoanpt/AI/Tailieu-TriTueNhanTao_new1.pdf
https://kenhdaihoc.net/threads/giao-trinh-tri-tue-nhan-tao-dhqg-ha-noi.19164/

https://fit.lqdtu.edu.vn/files/FileMonHoc/1.%20TTNT.pdf
https://users.soict.hust.edu.vn/quangnn/ai/slides/L4-Tim_kiem_heuristic.pdf (giữ nguyên cả cụm)
https://fit.mta.edu.vn/files/FileMonHoc/1.%20DC%20CT%20Trf%20tu_%20nhGn%20t_o.pdf

Slide này cũng khá mang tính cá nhân của người dạy, tuy nhiên chỉ có 1 từ "tìm kiếm chùm" trong slide, còn thầy này sử dụng 3 từ tìm kiếm beam trong slide :)) ???

Mình thấy giáo trình Trí Tuệ Nhân Tạo của Học Viện Kỹ Thuật Quân Sự cũng dịch là tìm kiếm chùm.
https://fit.lqdtu.edu.vn/files/FileMonHoc/1.%20TTNT.pdf

Mình thắc mắc lại câu trả lời của Phúc:

Mình vote là chùm tia do từ beam ở đây được xài với nghĩa thông dụng của nó, cũng không có gì sợ nhầm lẫn.

"Thông dụng" ở đây là thông dụng trong lĩnh vực nào, rõ ràng chưa có tài liệu chính thống nào mình search được trên GG sử dụng "tìm kiếm chùm (tia)" ngược lại thì có rất nhiều sách giáo trình đã sử dụng từ này.

Dù số đông vote "thích" ở đây nhưng mình nghĩ final thought cũng nên count cả những học giả trước nữa :)))

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

từ beam vẫn mang ý nghĩa chùm thông thường => Mình thấy tìm kiếm chùm vừa tổng quát lại chính xác.

Thêm một cmt nữa nếu Phúc có thể làm rõ hơn từ "tổng quát" là trong TH nào và chính xác là trong trường hợp nào? Mình thì thấy hơi cấn khi ghép từ "chùm" vào 1 cây. Có chùm nho, chùm quả, v.v. chứ rất ít khi nghe chùm cành, chùm lá, chùm nút, v.v. Và cũng từ cách hiểu từ chùm như vậy nên ta nghĩ rằng phần tử thuộc chùm sẽ có cùng cha (ví dụ chùm nho thì sẽ có cùng cuống). Trong search beam, thực tế là không hẳn 100% top-K các node (nút hoặc lá với cây được sinh so far) không luôn luôn có cùng nút cha. Nên "chính xác" thì mình thấy chưa đúng lắm với "search beam" khi dịch ra tiếng Việt.

Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

chứ rất ít khi nghe chùm cành, chùm lá, chùm nút, v.v.

Mình lại thấy các từ này hoàn toàn bình thường. Một điều mình nhận thấy qua nhiều thảo luận nhiều thuật ngữ khác nhau là đa phần lý do mọi người bàn cãi nhiều là vì khác biệt hiểu biết trong tiếng việt chứ không ở bản thân thuật ngữ tiếng anh. Có lẽ ta đã tới mức này với từ beam :).

Trong search beam, thực tế là không hẳn 100% top-K các node (nút hoặc lá với cây được sinh so far) không luôn luôn có cùng nút cha. Nên "chính xác" thì mình thấy chưa đúng lắm với "search beam" khi dịch ra tiếng Việt.

Như trong trường hợp này, nếu mình đi đủ xa thì tất cả các nhánh đều cũng sẽ có chung một gốc thôi đúng không, tất cả các từ được sinh ra đều có chung gốc token bos - beginning of sequence. Mình thấy không nên đi quá sâu vào hình ảnh liên tưởng của một thuật ngữ vì như trên, cùng một từ nhưng hình ảnh liên tưởng chỉ tiết của mỗi người một khác. Mình chỉ cần nắm bắt được hình ảnh chung và tổng quát là được.

Dù số đông vote "thích" ở đây nhưng mình nghĩ final thought cũng nên count cả những học giả trước nữa :)))
Thêm một cmt nữa nếu Phúc có thể làm rõ hơn từ "tổng quát" là trong TH nào và chính xác là trong trường hợp nào?

"Thông dụng và tổng quát" ý mình chính xác là nó không có mang một ý nghĩa đặc biệt nào trong ngữ cảnh này cả.
Giông như hill climbing được dịch là thuật toán leo đồi, hill ở đây mang nghĩa thông dụng là đồi núi, không có ý nghĩa gì đặc biệt khác trong. Tương tự beam ở đây chỉ một chùm, tức một nhóm nhỏ, ko có ý nghĩa gì đặc biệt trong trường hợp này.

Mình hiểu là nếu đã được học qua với từ tìm kiếm beam thì sẽ thấy rất kì khi nó được dịch qua tiếng việt, nhưng tiêu chí của dự án mình là luôn cố dịch nhiều nhất có thể, chỉ vay mượn khi không có từ nào có thể thay thế.

Thank @davidnvq đã có nhưng chia sẻ rất thú vị. Tới đây mình nghĩ là ta đã hiểu ý nhau hết rồi, và cũng tin rằng không ai có thể thuyết phục ai được nữa nên xin gác lại tại đây và chờ @duythanhvn cho phán xét cuối cùng.

Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Mình xin tổng kết từ này là tìm kiếm chùm anh em nhé.

Trọng điểm của dự án khi thảo luận những thuật ngữ khi không có từ thay thế mới không dịch từ này sang tiếng Việt. Mình cũng thông tin với anh em là ở đây, chúng ta giới hạn từ này (và những thuật ngữ được thảo luận trước đó cùng những thuật ngữ sẽ được thảo luận trong tương lai) được dịch để sử dụng riêng cho tài liệu này, cuốn sách này; vì vậy mà nếu nó phục vụ được cho mục tiêu đó mà không có bất kỳ vấn đề gì khác thì mình không có lý do để mà không dịch.

Nếu ở những tài liệu được dẫn nguồn trên giữ nguyên mà ta không chỉ ra được bất kỳ lý do vì sao họ lại giữ nguyên (ngoài lý do cố hữu là vì tôi không tìm được từ phù hợp thì tôi không dịch ra), thì ở bản thân mình cũng không có lý do gì để không đề xuất cách dịch này nhằm có sự thông dụng mới trong việc sử dụng thuật ngữ này trong hiện tại.

Hiện tại mình tạm chốt thuật ngữ này như thế này đã nhé. Ta có thể thảo luận thêm khi ta có thêm nguồn lực, thêm hiểu biết, thêm góc nhìn anh em nha.

@thanhcsf thanhcsf added this to In progress in Glossary via automation Jun 11, 2020
@thanhcsf thanhcsf added this to Review in progress in v0.14.x via automation Jun 11, 2020
@davidnvq davidnvq mentioned this pull request Jun 11, 2020
7 tasks
@lkhphuc lkhphuc mentioned this pull request Jun 11, 2020
7 tasks
@davidnvq davidnvq mentioned this pull request Jun 12, 2020
7 tasks
glossary.md Outdated Show resolved Hide resolved
v0.14.x automation moved this from Review in progress to Reviewer approved Jun 16, 2020
@thanhcsf thanhcsf merged commit ebe12bd into d2l-ai:master Jun 16, 2020
v0.14.x automation moved this from Reviewer approved to Done Jun 16, 2020
Glossary automation moved this from In progress to Done Jun 16, 2020
thanhcsf pushed a commit that referenced this pull request Sep 13, 2020
* Add "beam search"

* Add discussion link

* Apply suggestions from code review

Co-authored-by: Duy–Thanh Doan <tech@duythanh.vn>
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
No open projects
Glossary
  
Done
v0.14.x
  
Done (Max)
Development

Successfully merging this pull request may close these issues.

None yet

6 participants