New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Dịch chương 26 #193
Dịch chương 26 #193
Conversation
ở chap 22 mình cũng gặp từ background noise & mượn tạp cách dịch của google là "tạp âm". Trong bản dịch chap này mình thấy bạn dịch là "nhiễu nền". Nếu mọi người ok với cách dịch là "nhiễu nền" thì mình update chương của mình. |
Uh lúc đầu mình cũng tính lấy chữ tạp âm mà sau thấy nhiễu nền có vẻ gần với gốc hơn nên pick cách dịch này @william-vu |
Từ "nhiễu nền" đã được sử dụng ở nhiều nơi: @seanphan mình đã cập nhật từ này vào glossary qua #194 để không phải chờ đến khi cả PR lớn này được merge. Bạn rebase vào master hoặc:
để tránh conflict nhé. |
Mình đã resolve conflict nhé |
chapters/ch26.md
Outdated
Your algorithm must perform well on the training set before you can expect it to perform well on the dev/test sets. | ||
-> | ||
|
||
Thuật toán của bạn phải hoạt động tốt trên tập huấn luyện trước khi bạn có thể mong đợi nó hoạt động tốt trên tập phát triển / kiểm tra. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
không có dấu cách quanh '/'.
chapters/ch26.md
Outdated
For example, suppose you are building a speech recognition system for an app and have collected a training set of audio clips from volunteers. If your system is not doing well on the training set, you might consider listening to a set of ~100 examples that the algorithm is doing poorly on to understand the major categories of training set errors. Similar to the dev set error analysis, you can count the errors in different categories: | ||
-> | ||
|
||
Ví dụ: giả sử bạn đang xây dựng một hệ thống nhận dạng giọng nói cho một ứng dụng và đã thu thập một tập huấn luyện gồm các đoạn âm thanh từ các tình nguyện viên. Nếu hệ thống của bạn không hoạt động tốt trên tập huấn luyện, bạn có thể xem xét việc nghe một bộ ~ 100 mẫu mà thuật toán hoạt động kém để hiểu các loại lỗi chính của tập huấn luyện. Tương tự như phân tích lỗi ở tập phát triển, bạn có thể đếm các lỗi trong các danh mục khác nhau: |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
có thể thay dấu "~" bằng từ "khoảng". Hoặc nếu giữ nguyên thì không có dấu cách giữa nó và số 100.
- "categories" được dịch là "hạng mục" từ nhiều chương trước.
chapters/ch26.md
Outdated
| 2 | x | | x | Tiếng ồn nhà hàng | | ||
| 3 | | x | x | Nguời dùng la hét khắp phòng khách? | | ||
| 4 | x | | | Quán cà phê | | ||
| % tổng thể | 75% | 25% | 50% | |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Bảng này không hiện đúng khi hiển thị. Mình không rõ lỗi tại đâu, bạn thử vài cách xem.
chapters/ch26.md
Outdated
|
||
In this example, you might realize that your algorithm is having a particularly hard time with training examples that have a lot of background noise. Thus, you might focus on techniques that allow it to better fit training examples with background noise. | ||
-> | ||
|
||
Trong ví dụ này, bạn có thể nhận ra rằng thuật toán của bạn đang có một thời gian đặc biệt khó khăn với các mẫu huấn luyện có nhiều nhiễu nền. Do đó, bạn có thể tập trung vào các kỹ thuật cho phép nó khớp hơn với các ví dụ đào tạo với nhiễu nền. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Đoạn này giống Google translate quá :).
Từ "training" được dịch là "huấn luyện" chứ không phải "đào tạo"
chapters/ch26.md
Outdated
You might also double-check whether it is possible for a person to transcribe these audio clips, given the same input audio as your learning algorithm. If there is so much background noise that it is simply impossible for anyone to make out what was said, then it might be unreasonable to expect any algorithm to correctly recognize such utterances. We will discuss the benefits of comparing your algorithm to human-level performance in a later section. | ||
-> | ||
|
||
Bạn cũng có thể kiểm tra kỹ xem một người có thể sao chép các clip âm thanh này hay không, đưa ra âm thanh đầu vào giống như thuật toán learning của bạn. Nếu có quá nhiều nhiễu nền mà đơn giản là không ai có thể phát hiện ra những gì đã nói, thì có thể sẽ không hợp lý khi mong đợi bất kỳ thuật toán nào nhận ra chính xác những phát ngôn đó. Chúng ta sẽ thảo luận về lợi ích của việc so sánh thuật toán của bạn với hiệu suất ở cấp độ con người trong phần sau. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
"thuật toán learning" -> "thuật toán học"
"human-level performance" ở chương sau có chỗ được dịch là "hiệu quả cấp con người".
Từ "performance" mình cũng đã dịch là "hiệu quả" từ đầu rồi.
Mình đóng PR này vì tác giả không phản hồi sau 3 ngày. |
@aivivn ơi, mình đã resolved conflict của @tiepvupsu 3 ngày truớc. Bạn add comment 21 tiếng truớc mình sẽ cần thời gian update chứ bạn ? |
Bạn mở PR lại mình sẽ update trong hôm nay nhé @aivivn |
Cảm ơn bạn. Mình nghĩ bạn có việc bận nên không thể tiếp tục được. |
Xin lỗi bạn. Mình không thấy bạn active mấy hôm nay, cả ở các PRs khác nên nghĩ bạn bận. Mình nghĩ sẽ tốt hơn nếu chúng ta giải quyết từng PR trước khi sang PR khác. Phòng trường hợp một bạn có lý do cá nhân không thể tiếp tục làm việc trên một PR được thì công sức review sẽ đổ bể. Cảm ơn bạn rất nhiều vì đã quay lại tiếp tục đóng góp. |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
Bản update trước của bạn khá ổn rồi. Mình chỉ sửa lại một vài chỗ và sửa format trước khi merge.
Cảm ơn bạn rất nhiều vì những đóng góp trong những chương vừa rồi.
Cảm ơn bạn @tiepvupsu nhiều ! |
Nếu bạn tạo Pull Request để dịch, vui lòng hoàn thành các thông tin dưới đây.
Đánh dấu [x] (không có dấu cách quanh x) thể hiện dấu tick vào các câu dưới đây cho các câu trả lời 'Có' hoặc 'Đúng'
Pull Request này được link tới một issue? Đánh số issue đó ngay sau dấu Dịch chương 26 #188
Bạn có kiến thức về Machine Learning không? Chúng tôi ưu tiên những người có trước kiến thức về Machine Learning để việc review được thuận tiện hơn.
Bạn đã đọc Bảng thuật ngữ chưa? Bạn cần dịch các thuật ngữ theo bảng thuật ngữ chung.
Tất cả các thuật ngữ trong chương này đã có trong Bảng thuật ngữ chưa? Nếu chưa, bạn có thể tạo một issue hoặc pull request mới để bổ sung nghĩa của từ đó vào Bảng thuật ngữ.
Pull request này đã sẵn sàng cho việc review chưa? Nếu đã sẵn sàng, bạn vui lòng gán label 'review wanted' cho pull request này. Nếu chưa, bạn vui lòng thêm cụm "[WIP]" (work in progress) vào trước tiêu đề của pull request.
Lưu ý
Chỉ bắt đầu review khi mọi mục trên đây đều đã được tick.