Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Dịch chương 26 #193

Merged
merged 3 commits into from Nov 3, 2019
Merged

Dịch chương 26 #193

merged 3 commits into from Nov 3, 2019

Conversation

seanphan
Copy link
Contributor

Nếu bạn tạo Pull Request để dịch, vui lòng hoàn thành các thông tin dưới đây.

  • Đánh dấu [x] (không có dấu cách quanh x) thể hiện dấu tick vào các câu dưới đây cho các câu trả lời 'Có' hoặc 'Đúng'

  • Pull Request này được link tới một issue? Đánh số issue đó ngay sau dấu Dịch chương 26 #188

  • Bạn có kiến thức về Machine Learning không? Chúng tôi ưu tiên những người có trước kiến thức về Machine Learning để việc review được thuận tiện hơn.

  • Bạn đã đọc Bảng thuật ngữ chưa? Bạn cần dịch các thuật ngữ theo bảng thuật ngữ chung.

  • Tất cả các thuật ngữ trong chương này đã có trong Bảng thuật ngữ chưa? Nếu chưa, bạn có thể tạo một issue hoặc pull request mới để bổ sung nghĩa của từ đó vào Bảng thuật ngữ.

  • Pull request này đã sẵn sàng cho việc review chưa? Nếu đã sẵn sàng, bạn vui lòng gán label 'review wanted' cho pull request này. Nếu chưa, bạn vui lòng thêm cụm "[WIP]" (work in progress) vào trước tiêu đề của pull request.

Lưu ý

Chỉ bắt đầu review khi mọi mục trên đây đều đã được tick.

@william-vu
Copy link
Contributor

william-vu commented Oct 29, 2019

ở chap 22 mình cũng gặp từ background noise & mượn tạp cách dịch của google là "tạp âm". Trong bản dịch chap này mình thấy bạn dịch là "nhiễu nền". Nếu mọi người ok với cách dịch là "nhiễu nền" thì mình update chương của mình.
@seanphan @tiepvupsu @ngcthuong

@seanphan
Copy link
Contributor Author

Uh lúc đầu mình cũng tính lấy chữ tạp âm mà sau thấy nhiễu nền có vẻ gần với gốc hơn nên pick cách dịch này @william-vu

@tiepvupsu
Copy link
Contributor

tiepvupsu commented Oct 29, 2019

Từ "nhiễu nền" đã được sử dụng ở nhiều nơi:
https://www.google.com/search?q=nhi%E1%BB%85u+n%E1%BB%81n&ie=utf-8&oe=utf-8&aq=t

@seanphan mình đã cập nhật từ này vào glossary qua #194 để không phải chờ đến khi cả PR lớn này được merge. Bạn rebase vào master hoặc:

git checkout master -- glossary.md

để tránh conflict nhé.

@seanphan
Copy link
Contributor Author

Mình đã resolve conflict nhé

@tiepvupsu tiepvupsu changed the title add chapter 26 and update glossary fỏ background noise Dịch chương 26 Oct 30, 2019
@tiepvupsu tiepvupsu added this to the Phần 4 (chương 23-27) milestone Oct 31, 2019
chapters/ch26.md Outdated
Your algorithm must perform well on the training set before you can expect it to perform well on the dev/test sets.
->

Thuật toán của bạn phải hoạt động tốt trên tập huấn luyện trước khi bạn có thể mong đợi nó hoạt động tốt trên tập phát triển / kiểm tra.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

không có dấu cách quanh '/'.

chapters/ch26.md Outdated
For example, suppose you are building a speech recognition system for an app and have collected a training set of audio clips from volunteers. If your system is not doing well on the training set, you might consider listening to a set of ~100 examples that the algorithm is doing poorly on to understand the major categories of training set errors. Similar to the dev set error analysis, you can count the errors in different categories:
->

Ví dụ: giả sử bạn đang xây dựng một hệ thống nhận dạng giọng nói cho một ứng dụng và đã thu thập một tập huấn luyện gồm các đoạn âm thanh từ các tình nguyện viên. Nếu hệ thống của bạn không hoạt động tốt trên tập huấn luyện, bạn có thể xem xét việc nghe một bộ ~ 100 mẫu mà thuật toán hoạt động kém để hiểu các loại lỗi chính của tập huấn luyện. Tương tự như phân tích lỗi ở tập phát triển, bạn có thể đếm các lỗi trong các danh mục khác nhau:
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

có thể thay dấu "~" bằng từ "khoảng". Hoặc nếu giữ nguyên thì không có dấu cách giữa nó và số 100.

  • "categories" được dịch là "hạng mục" từ nhiều chương trước.

chapters/ch26.md Outdated
| 2 | x | | x | Tiếng ồn nhà hàng |
| 3 | | x | x | Nguời dùng la hét khắp phòng khách? |
| 4 | x | | | Quán cà phê |
| % tổng thể | 75% | 25% | 50% |
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Bảng này không hiện đúng khi hiển thị. Mình không rõ lỗi tại đâu, bạn thử vài cách xem.

chapters/ch26.md Outdated

In this example, you might realize that your algorithm is having a particularly hard time with training examples that have a lot of background noise. Thus, you might focus on techniques that allow it to better fit training examples with background noise.
->

Trong ví dụ này, bạn có thể nhận ra rằng thuật toán của bạn đang có một thời gian đặc biệt khó khăn với các mẫu huấn luyện có nhiều nhiễu nền. Do đó, bạn có thể tập trung vào các kỹ thuật cho phép nó khớp hơn với các ví dụ đào tạo với nhiễu nền.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Đoạn này giống Google translate quá :).

Từ "training" được dịch là "huấn luyện" chứ không phải "đào tạo"

chapters/ch26.md Outdated
You might also double-check whether it is possible for a person to transcribe these audio clips, given the same input audio as your learning algorithm. If there is so much background noise that it is simply impossible for anyone to make out what was said, then it might be unreasonable to expect any algorithm to correctly recognize such utterances. We will discuss the benefits of comparing your algorithm to human-level performance in a later section.
->

Bạn cũng có thể kiểm tra kỹ xem một người có thể sao chép các clip âm thanh này hay không, đưa ra âm thanh đầu vào giống như thuật toán learning của bạn. Nếu có quá nhiều nhiễu nền mà đơn giản là không ai có thể phát hiện ra những gì đã nói, thì có thể sẽ không hợp lý khi mong đợi bất kỳ thuật toán nào nhận ra chính xác những phát ngôn đó. Chúng ta sẽ thảo luận về lợi ích của việc so sánh thuật toán của bạn với hiệu suất ở cấp độ con người trong phần sau.
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

"thuật toán learning" -> "thuật toán học"

"human-level performance" ở chương sau có chỗ được dịch là "hiệu quả cấp con người".

Từ "performance" mình cũng đã dịch là "hiệu quả" từ đầu rồi.

@aivivn
Copy link
Collaborator

aivivn commented Nov 2, 2019

Mình đóng PR này vì tác giả không phản hồi sau 3 ngày.

@aivivn aivivn closed this Nov 2, 2019
This was referenced Nov 2, 2019
@seanphan
Copy link
Contributor Author

seanphan commented Nov 2, 2019

@aivivn ơi, mình đã resolved conflict của @tiepvupsu 3 ngày truớc. Bạn add comment 21 tiếng truớc mình sẽ cần thời gian update chứ bạn ?

image

@seanphan
Copy link
Contributor Author

seanphan commented Nov 2, 2019

Bạn mở PR lại mình sẽ update trong hôm nay nhé @aivivn

@tiepvupsu tiepvupsu reopened this Nov 2, 2019
@tiepvupsu
Copy link
Contributor

Bạn mở PR lại mình sẽ update trong hôm nay nhé @aivivn

Cảm ơn bạn. Mình nghĩ bạn có việc bận nên không thể tiếp tục được.

@aivivn
Copy link
Collaborator

aivivn commented Nov 2, 2019

@aivivn ơi, mình đã resolved conflict của @tiepvupsu 3 ngày truớc. Bạn add comment 21 tiếng truớc mình sẽ cần thời gian update chứ bạn ?

image

Xin lỗi bạn. Mình không thấy bạn active mấy hôm nay, cả ở các PRs khác nên nghĩ bạn bận.

Mình nghĩ sẽ tốt hơn nếu chúng ta giải quyết từng PR trước khi sang PR khác. Phòng trường hợp một bạn có lý do cá nhân không thể tiếp tục làm việc trên một PR được thì công sức review sẽ đổ bể.

Cảm ơn bạn rất nhiều vì đã quay lại tiếp tục đóng góp.

@aivivn aivivn added high priority Cần được hoàn thành sớm review wanted Pull Request cần được review sớm labels Nov 3, 2019
Copy link
Contributor

@tiepvupsu tiepvupsu left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Bản update trước của bạn khá ổn rồi. Mình chỉ sửa lại một vài chỗ và sửa format trước khi merge.

Cảm ơn bạn rất nhiều vì những đóng góp trong những chương vừa rồi.

@aivivn aivivn merged commit 475cfa6 into mlbvn:master Nov 3, 2019
@seanphan
Copy link
Contributor Author

seanphan commented Nov 3, 2019

Cảm ơn bạn @tiepvupsu nhiều !

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
high priority Cần được hoàn thành sớm review wanted Pull Request cần được review sớm
Projects
None yet
Development

Successfully merging this pull request may close these issues.

None yet

4 participants