Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Thêm glossary black box/ eyeball dev set #162

Merged
merged 2 commits into from Oct 29, 2019

Conversation

khoapip
Copy link
Contributor

@khoapip khoapip commented Oct 25, 2019

Trong quá trình dịch chương 17 em có gặp 2 từ black box dev set và eyeball dev set. Em định dịch là tập phát triển mở / tập phát triển đóng (hoặc kín) nhưng dịch 2 thuật ngữ này còn ảnh hưởng đến cách dịch của câu ngay sau đấy:

You should randomly select 10% of the dev set and place that into what we’ll call an ​Eyeball dev set​ to remind ourselves that we are looking at it with our eyes. (For a project on speech recognition, in which you would be listening to audio clips, perhaps you would call this set an Ear dev set instead).

Mong mọi người cho ý kiến ạ

@tiepvupsu
Copy link
Contributor

Mình cũng thấy cách dịch này sát nghĩa và dễ hiểu. Nếu trong không ai có ý kiến khác thì sẽ approve sau 1 ngày.

@tiepvupsu tiepvupsu added the high priority Cần được hoàn thành sớm label Oct 25, 2019
@william-vu
Copy link
Contributor

william-vu commented Oct 25, 2019

em thì nghĩ là "tập phát triển mở/đóng" chưa diễn đạt hết ý của "eyeball/blackbox dev set" nếu như đặt vào context của chapter 14->18 & error analysis:
(1) trong context của các chương kìa, theo e hiểu thì là eyeball dev refer đến việc khi mình nhìn/nghe ... (nói chung là dùng giác quan) thì có thể hiểu được data sample là gì, và nếu classifier phân loại sai, sai thì có intuition tại sao sai; khi dịch thành "đóng/mở" intuition này có vẻ không còn nữa
(2) "đóng/mở" dễ bị lẫn với mã nguồn đóng/mở, không liên quan lắm tới context của chap 14-18
(3) vì là dev set, mình hoàn toàn có quyền truy cập, xem xét nó nên nếu nói khái niệm "đóng" trong context này khá là ambiguous.

em cũng chưa có đề xuất thay thế, nhưng nếu giữ lại nguyên bản (sẽ dịch sau) thì sẽ loại được ambiguous đi.

@william-vu
Copy link
Contributor

updated cho comment trên:
sau khi đọc kĩ lại chap 17, e thấy (3) arguments trên của e không hợp lý. Bác Tiệp và author skip nhé.

@freeloneman
Copy link
Contributor

Theo mình thì cứ dịch eyeball dev set là "tập phát triển nhãn cầu" cho đúng ý với tác giả muốn ta hãy "mở mắt nhìn nó", còn đây có phải là thuật ngữ chuyên ngành để đưa vào glossary hay chỉ là 1 cách gọi của tác giả thì cần tìm hiểu thêm. Tương tự, blackbox dev set dịchh là "tâp phát triển hộp đen"

@khoapip
Copy link
Contributor Author

khoapip commented Oct 26, 2019

Em thì thấy ý của mọi người cũng đúng nếu dịch là "tập phát triển nhãn cầu", điểm trừ là kiểu dịch này không dễ hiểu lắm và nghe khá lủng củng. Nếu dịch là "tập phát triển mở" thì dễ hiểu và cũng sát nghĩa, nhưng điểm trừ sẽ phải điều chỉnh dịch phần sau của tác giả. Lát em dịch xong sẽ tạo 1 pull request chương 17 để mọi người xem phần dịch có hợp lý ko.

@khoapip
Copy link
Contributor Author

khoapip commented Oct 26, 2019

#168
Black Box Dev Set thì em vẫn nghĩ nên dịch là "tập phát triển đóng/ kín". Lúc em dịch thì em thấy từ eyeball khá là specific với ví dụ phân tích ảnh này, nếu dịch là "tập phát triển mở" thì sẽ phải thay đổi đoạn dịch ngay sau đó:

You should randomly select 10% of the dev set and place that into what we’ll call an ​Eyeball dev set​ to remind ourselves that we are looking at it with our eyes. (For a project on speech recognition, in which you would be listening to audio clips, perhaps you would call this set an Ear dev set instead).
-> Bạn nên chọn ra 10% mẫu trong tập phát triển một cách ngẫu nhiên và đặt nó vào trong một tập mà chúng ta sẽ gọi là tập phát triển mở để nhắc chúng ta rằng ta sẽ trực tiếp phân tích thủ công tập này.(Đối với những dự án nhận dạng ảnh, hay nhận giọng nói, bạn có thể gọi tập này là tập phát triển nhìn được hoặc nghe được).

Kiểu này sẽ phải thay đổi khác với source nên em nghĩ để "nhãn cầu" cũng hợp lý với ví dụ này. Còn phần blackbox thì mọi người cho ý kiến

@freeloneman
Copy link
Contributor

Mình đã search từ khóa này và thấy chỉ có vài kết quả và hầu như liên quan đến tác giả, nên theo mình thì là từ do ông ấy đặt nên cần tôn trọng ý của ổng muốn nhấn mạnh chữ "eye", và không quá lo nó nghe "lạ tai"

@freeloneman
Copy link
Contributor

Mình nghĩ remind ourselves that we are looking at it with our eyes nên dịch là "tự nhắc nhở rằng chúng ta sẽ để mắt đến"

@freeloneman
Copy link
Contributor

Blackbox cũng tương tự, tác giả muốn nhấn mạnh đến cái "lỗ đen" nơi mà người ta không biết nó là gì, và không cần phải để ý đến. Nên mình nghĩ là vẫn cứ dịch sát nghĩa

@seanphan
Copy link
Contributor

Mình nghĩ có thể giữ nguyên tên là "tập phát triển Eyeball" và "tập phát triển Blackbox" để theo ý tác giả. Để tập phát triển Nhãn cầu đọc không thuận lắm. Đối với độc giả của cuốn này mình nghĩ để nguyên Eyeball/Blackbox mọi người cũng sẽ hiểu được ý tác giả khi đặt tên này.

@khoapip khoapip mentioned this pull request Oct 26, 2019
6 tasks
@tiepvupsu
Copy link
Contributor

Mình đề xuất để là "tập phát triển Eyeball" và "tập phát triển Blackbox". Hai từ này thực ra không (chưa) phải là thuật ngữ trong machine learning. Hiện tại mới xuất hiện trong cuốn sách này.

Sau nếu có đề xuất tốt hơn thì thay đổi toàn bộ.

@ngcthuong
Copy link
Contributor

Eyeball dev set dịch là "tập phát triển tự kiểm" có được ko nhỉ? Vì ý là tự mình phải kiểm tra tập này?

@tiepvupsu
Copy link
Contributor

Eyeball dev set dịch là "tập phát triển tự kiểm" có được ko nhỉ? Vì ý là tự mình phải kiểm tra tập này?

Từ này tớ không nghĩ mình nên mất thời gian quá nhiều để dịch, chốt lại để move on thôi. Không nên vì nó mà block các chương khác.

Tạm thời cứ để là "Eyeball" và "Blackbox", nếu cần thì thêm giải thích của người dịch vào.

@khoapip bạn có thể thêm một comment để sửa lại thành "Eyeball" và "Blackbox" được không? Sau đó mình sẽ approve.

@khoapip
Copy link
Contributor Author

khoapip commented Oct 28, 2019

Em đã update theo như mọi người gợi ý ạ

@tiepvupsu tiepvupsu merged commit d70b969 into mlbvn:master Oct 29, 2019
@khoapip khoapip deleted the glossary_black_box branch November 1, 2019 11:14
@Khiem179
Copy link

Mình nghĩ là nếu để nguyên từ Eyeball thì nên có giải thích ý nghĩa cho nó ở cuối trang sách. Bởi vì tập phát triển Eyeball như mình hiểu là một tập còn mà người ta lấy riêng ra để phân tích cụ thể (nhìn trực tiếp bằng mắt của mình chứ không qua các công cụ đánh giá khác) xem tại sao mô hình lại dự đoán sai.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
high priority Cần được hoàn thành sớm
Projects
None yet
Development

Successfully merging this pull request may close these issues.

None yet

7 participants