Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Dịch chap 04 #83

Merged
merged 8 commits into from
Oct 21, 2019
Merged

Dịch chap 04 #83

merged 8 commits into from
Oct 21, 2019

Conversation

ngcthuong
Copy link
Contributor

1st draft

1st draft
@ngcthuong ngcthuong changed the title 1st draft Dịch chap 4 Oct 20, 2019
@ngcthuong ngcthuong changed the title Dịch chap 4 Dịch chap 04 Oct 20, 2019
chapters/ch04.md Outdated
@@ -2,31 +2,49 @@

->

# Quy Mô Quyết Định Quá Trình Machine Learning

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "Scale drives machine learning progress" -> Câu này theo em thấy có thể dịch là "Quy mô quyết định sự phát triển machine learning" hoặc là "Quy mô quyết định tiến độ machine learning" !!

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Quy Mô Quyết Định Tiến Trình Phát Triển Machine Learning?

Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Như @1612628 "Quy mô (bigger nettwork, more data) quyết định (kích thích) sự phát triển của ML" có vẻ mượt nhất :D

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • bỏ qua từ kích thích
  • progress ở đây theo nội dung của bài giống như là chất lượng của ML nhiều hơn.
  • Mình muốn cọn tiêu đề ngắn gọn, bỏ từ thừa

chapters/ch04.md Outdated Show resolved Hide resolved
chapters/ch04.md Outdated Show resolved Hide resolved
chapters/ch04.md Outdated Show resolved Hide resolved
@ngcthuong ngcthuong added the review wanted Pull Request cần được review sớm label Oct 20, 2019
chapters/ch04.md Outdated
->
->

**Quy mô năng lực tính toán**. Chỉ vài năm gần đây chúng ta mới bắt đầu huấn luyện mạng neural đủ lớn để tận dụng lượng dữ liệu lớn kể trên.
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "mới bắt đầu" -> "mới có thể", có thể bắt đầu từ lâu nhưng giờ mới có thể làm được.

chapters/ch04.md Outdated


In detail, even as you accumulate more data, usually the performance of older learning algorithms, such as logistic regression, “plateaus.” This means its learning curve “flattens out,” and the algorithm stops improving even as you give it more data:

->

Cho dù có thêm nhiều nhiều dữ liệu nữa, thì hiệu quả của thuật toán học máy thế hệ cũ như hồi quy logistic cũng chẳng mảy may cải thiện. Nghĩa là đồ thị chất lượng học nằm ngang và thuật toán sẽ không cải thiện chất lượng cho dù thêm bao nhiêu dữ liệu.
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "hiệu quả" có thể thay bằng "hiệu suất" hoặc "chất lượng" nghe có vẻ hay hơn.

Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Em thấy hiệu suất thì sát nghĩa hơn, nên em vote hiệu suất 😄

Copy link
Contributor

@tiepvupsu tiepvupsu Oct 20, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Từ 'learning curve' mình nghĩ dịch là 'tiến trình học' nghe mượt hơn. Cách giải nghĩa cụm 'learning curve' bằng tiếng Anh:

the rate of a person's progress in gaining experience or new skills.

Câu thứ hai mình đề xuất dịch là:

"Điều này nghĩa là tiến trình học chững lại, và thuật toán ngừng cải thiện cho dù có thêm dữ liệu".

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Hiệu suất (thường có thể đo được) là khả năng tránh lãng phí vật liệu, năng lượng, nỗ lực, tiền bạc và thời gian để làm một việc gì đó hay tạo ra kết quả mong

Từ hiệu suất không chuẩn

chapters/ch04.md Outdated

If you train a small neutral network (NN) on the same supervised learning task, you might get slightly better performance:

->

Nếu bạn huấn luyện một mạng neural nhỏ cho cùng một tác vụ học có kiểm soát, có thể bạn sẽ đạt chất lượng cao hơn một chút
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "supervised learning" -> "học có giám sát" cho chuẩn

chapters/ch04.md Outdated Show resolved Hide resolved
chapters/ch04.md Outdated
@@ -55,12 +81,16 @@ Thus, you obtain the best performance when you (i) Train a very large neural net

->

Vì thế bạn chỉ thu về chất lượng tốt nhất khi (i) huấn luyện mạng neural rất lớn tương ứng với đường chất lượng màu xanh trong hình vẽ và (ii) khi có lượng dữ liệu cực lớn.
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "chỉ thu về chất lượng tốt nhất" -> maybe "đạt được kết quả tốt nhất"
  • Ở đây có 2 màu xanh, có lẽ nên ghi xanh lá cây (green)

Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Ở đây có 2 màu xanh, có lẽ nên ghi xanh lá cây (green)

Mình đề xuất dùng 'lục' hoặc 'xanh lục' để chỉ màu 'green', và 'lam' hoặc 'xanh lam' để chỉ màu 'blue'.

chapters/ch04.md Outdated
@@ -69,9 +99,13 @@ Many other details such as neural network architecture are also important, and t

->

[1] Hình vẽ thể hiện mạng neural cho kết quả tốt hơn trong điều kiện dữ liệu nhỏ. Nhận định này ít đồng thuận hơn với nhận định mạng neural với dữ liệu lớn. Đối với dữ liệu nhỏ, tùy thuộc vào cách tạo đặc trưng thủ công mà thuật toán truyền thống có thể hoặc không cho kết quả tốt hơn. Ví dụ như, nếu ta chỉ có 20 mẫu huấn luyện thì không đủ để dùng hồi suy logistic lẫn mạng neural. Nhưng đổi lại đặc trưng thủ công lại chịu ảnh hưởng nhiều từ thuật toán học máy. Nhưng nếu có 1 triệu mẫu thì tôi sẽ chọn mạng neural.
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "Hình vẽ thể hiện mạng neural cho kết quả tốt hơn trong điều kiện dữ liệu nhỏ. Nhận định này ít đồng thuận hơn với nhận định mạng neural với dữ liệu lớn. " maybe có thể viết như này

Mặc dù hình vẽ thể hiện mạng neural cho kết quả tốt hơn trong điều kiện dữ liệu nhỏ. Nhưng nhận định này nhận được ít sự đồng thuận hơn so với nhận định "Mạng neural cho kết quả tốt hơn rõ rệt với tập dữ liệu lớn".

  • "Ví dụ như, nếu ta chỉ có 20 mẫu huấn luyện thì không đủ để dùng hồi suy logistic lẫn mạng neural. Nhưng đổi lại đặc trưng thủ công lại chịu ảnh hưởng nhiều từ thuật toán học máy." nên là:

Ví dụ như, nếu bạn chỉ có 20 mẫu huấn luyện thì gần như việc bạn sử dụng hồi quy logistic hay mạng neural không quan trọng bằng kỹ thuật mà bạn trích xuất đặc trưng như thế nào.

Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Ví dụ như, nếu bạn chỉ có 20 mẫu huấn luyện thì gần như việc bạn sử dụng hồi quy logistic hay mạng neural không quan trọng bằng kỹ thuật mà bạn trích xuất đặc trưng như thế nào.

Câu bạn dịch thiếu mất một ý quan trọng ở chỗ cụm 'hand-engineering of features'. Mình chưa biết dịch cụm này thế nào cho ổn nhưng mình thấy cần thiết giữ ý này lại.

Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

@tiepvupsu Có thể dịch là "kỹ thuật trích xuất đặc trưng thủ công" được ko?

Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Mình thấy ok. Từ 'hand-engineering' cũng được đề xuất dịch như thế tại https://github.com/aivivn/Machine-Learning-Yearning-Vietnamese-Translation/pull/87/files.

Copy link
Contributor Author

@ngcthuong ngcthuong Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Mặc dù hình vẽ cho thấy mạng neural cho kết quả tốt hơn với dữ liệu nhỏ, nhưng nhận định này ít đồng thuận hơn với nhận định khi dùng mạng neural với dữ liệu lớn. Vì đối với dữ liệu nhỏ, chất lượng thuật toán truyền thống có thể hoặc không cho kết quả tốt hơn mạng neural phụ thuộc rất nhiều vào cách tạo đặc trưng thủ công.

Và nếu ta chỉ có 20 mẫu huấn luyện thì thực không đủ để dùng cả hồi suy logistic lẫn mạng neural. Nhưng đồng thời đặc trưng thủ công bị phụ thuộc nhiều vào thuật toán học máy. Nhưng đồng thời, đặc trưng thủ công bị phụ thuộc nhiều vào thuật toán học máy. Còn nếu có một triệu mẫu, thì tôi sẽ chọn dùng mạng neural.

chapters/ch04.md Outdated


The process of how to accomplish (i) and (ii) are surprisingly complex. This book will discuss the details at length. We will start with general strategies that are useful for both traditional learning algorithms and neural networks, and build up to the most modern strategies for building deep learning systems.

->

Bạn có thể bất ngờ với độ phức tạp của cả quá trình phát triển để đạt được điều (i) và (ii). Quyển sách này sẽ thảo luận chi tiết và sâu hơn. Chúng ta sẽ bắt đầu bằng những chiến thuật hữu dụng cho cả thuật toán truyền thống lẫn mạng neural, rồi từ từ xây dựng chiến thuật tân tiến nhất cho xây dựng mạng deep learning.
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "Bạn có thể bất ngờ với độ phức tạp của cả quá trình phát triển để đạt được điều (i) và (ii). " maybe:

Quá trình để đạt được điều (i) và (ii) phức tạp hơn bạn tưởng. Nhưng đừng lo, cuốn sách này sẽ thảo luận đầy đủ và chi tiết. Trước tiên chúng ta sẽ bắt đầu với chiến lược chung hữu ích cho cả thuật toán truyền thống lẫn mạng neural, rồi đến các phương pháp hiện đại nhất để xây dựng một hệ thống deep learning.

chapters/ch04.md Outdated Show resolved Hide resolved
chapters/ch04.md Outdated
@@ -69,9 +99,13 @@ Many other details such as neural network architecture are also important, and t

->

[1] Hình vẽ thể hiện mạng neural cho kết quả tốt hơn trong điều kiện dữ liệu nhỏ. Nhận định này ít đồng thuận hơn với nhận định mạng neural với dữ liệu lớn. Đối với dữ liệu nhỏ, tùy thuộc vào cách tạo đặc trưng thủ công mà thuật toán truyền thống có thể hoặc không cho kết quả tốt hơn. Ví dụ như, nếu ta chỉ có 20 mẫu huấn luyện thì không đủ để dùng hồi suy logistic lẫn mạng neural. Nhưng đổi lại đặc trưng thủ công lại chịu ảnh hưởng nhiều từ thuật toán học máy. Nhưng nếu có 1 triệu mẫu thì tôi sẽ chọn mạng neural.
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Ví dụ như, nếu bạn chỉ có 20 mẫu huấn luyện thì gần như việc bạn sử dụng hồi quy logistic hay mạng neural không quan trọng bằng kỹ thuật mà bạn trích xuất đặc trưng như thế nào.

Câu bạn dịch thiếu mất một ý quan trọng ở chỗ cụm 'hand-engineering of features'. Mình chưa biết dịch cụm này thế nào cho ổn nhưng mình thấy cần thiết giữ ý này lại.

@tiepvupsu tiepvupsu added the high priority Cần được hoàn thành sớm label Oct 20, 2019
chapters/ch04.md Outdated


In detail, even as you accumulate more data, usually the performance of older learning algorithms, such as logistic regression, “plateaus.” This means its learning curve “flattens out,” and the algorithm stops improving even as you give it more data:

->

Cho dù có thêm nhiều nhiều dữ liệu nữa, thì hiệu quả của thuật toán học máy thế hệ cũ như hồi quy logistic cũng chẳng mảy may cải thiện. Nghĩa là đồ thị chất lượng học nằm ngang và thuật toán sẽ không cải thiện chất lượng cho dù thêm bao nhiêu dữ liệu.
Copy link
Contributor

@quangnhat185 quangnhat185 Oct 20, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Em nghĩ không nên dùng "chẳng mảy may" trong hành văn học thuật. Có thể dịch ngắn gọn là:

" Cho dù có thêm nhiều nhiều dữ liệu nữa, thì hiệu quả hiệu suất của thuật toán học máy thế hệ cũ như hồi quy logistic cũng chẳng mảy may không thể cải thiện."

Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Từ 'performance' không có nghĩa là 'hiệu suất', 'hiệu suất' là dịch từ 'productivity' ra. Hiệu suất thường dùng để chỉ lượng công việc thực hiện được trong một đơn gị thời gian, nghĩa đó không phù hợp với hoàn cảnh này.

'Hiệu quả' hay 'kết quả' là từ phù hợp hơn trong văn cảnh này.

Copy link
Member

@lkhphuc lkhphuc left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Mình có góp ý chung là bản dịch này đọc thấy khá thô, vì chắc bạn dịch sát nghĩa.
Cái lỗi này nhiều người, ngay cả mình cũng mắc phải, đặc biệt khi dịch trên bản nháp của google translate ;)). Mình chỉ viết ra để luư ý lại cho mình và mọi ngưòi cho những chapter sau thôi.

chapters/ch04.md Outdated

Many of the ideas of deep learning (neural networks) have been around for decades. Why are these ideas taking off now?

->

Rất nhiều những ý tưởng của học sâu (mạng neural) đã xuất hiện từ hàng thập kỷ trước. Vậy tại sao tận bây giờ chúng mới cất cánh, mới bùng nổ như vậy?
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Không dịch deep learning

chapters/ch04.md Outdated

Two of the biggest drivers of recent progress have been:

->

Hai nguyên nhân mang tính quyết định tới những phát triển gần đây là
Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "tới những phát triển gần đây là" -> "tới sự phát triển trong thời qua" nghe tự nhiên hơn

Copy link
Contributor Author

@ngcthuong ngcthuong Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

mình nghĩ gần đây khác với thời gian qua do sự bùng nổ của GPU (computational) và dữ liệu. Trước đó nữa cũng đã có neural network rồi

chapters/ch04.md Outdated Show resolved Hide resolved
@ngcthuong
Copy link
Contributor Author

Mình có góp ý chung là bản dịch này đọc thấy khá thô, vì chắc bạn dịch sát nghĩa.
Cái lỗi này nhiều người, ngay cả mình cũng mắc phải, đặc biệt khi dịch trên bản nháp của google translate ;)). Mình chỉ viết ra để luư ý lại cho mình và mọi ngưòi cho những chapter sau thôi.

Mình không dùng Google translate. Và bản này đúng là bản dịch thô - bản nháp, chưa phải bản cuối cùng. Mình thường dịch 2-3 lần để cho mượt và bắtt đầu bằng bản dịch thô.

Copy link
Contributor

@tiepvupsu tiepvupsu left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Nếu đây vẫn là bản draft thì cậu đánh dấu là bản Draft hoặc thêm chữ [WIP] vào tiêu đề, như thế sẽ giảm lượng review không cần thiết đi. @ngcthuong

chapters/ch04.md Outdated


In detail, even as you accumulate more data, usually the performance of older learning algorithms, such as logistic regression, “plateaus.” This means its learning curve “flattens out,” and the algorithm stops improving even as you give it more data:

->

Cho dù có thêm nhiều nhiều dữ liệu nữa, thì hiệu quả của thuật toán học máy thế hệ cũ như hồi quy logistic cũng chẳng mảy may cải thiện. Nghĩa là đồ thị chất lượng học nằm ngang và thuật toán sẽ không cải thiện chất lượng cho dù thêm bao nhiêu dữ liệu.
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Từ 'performance' không có nghĩa là 'hiệu suất', 'hiệu suất' là dịch từ 'productivity' ra. Hiệu suất thường dùng để chỉ lượng công việc thực hiện được trong một đơn gị thời gian, nghĩa đó không phù hợp với hoàn cảnh này.

'Hiệu quả' hay 'kết quả' là từ phù hợp hơn trong văn cảnh này.

@ngcthuong
Copy link
Contributor Author

Nếu đây vẫn là bản draft thì cậu đánh dấu là bản Draft hoặc thêm chữ [WIP] vào tiêu đề, như thế sẽ giảm lượng review không cần thiết đi. @ngcthuong

Uhm để lần sau rút kinh nghiệm. Tạo nhãn draft và chỉ thêm review required sau khi dịch xong.

Tối về mình sẽ update.

@aivivn aivivn changed the title Dịch chap 04 [WIP] Dịch chap 04 Oct 21, 2019
@ngcthuong ngcthuong removed the review wanted Pull Request cần được review sớm label Oct 21, 2019
@ngcthuong ngcthuong changed the title [WIP] Dịch chap 04 Dịch chap 04 Oct 21, 2019
@ngcthuong ngcthuong added the review wanted Pull Request cần được review sớm label Oct 21, 2019
chapters/ch04.md Outdated
@@ -1,31 +1,38 @@
# Scale drives machine learning progress

->
# 4. Quy Mô Quyết Định Mô Hình Machine Learning
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Tiêu đề gốc không viết hoa chữ cái đầu cho mọi từ.

chapters/ch04.md Outdated


Many of the ideas of deep learning (neural networks) have been around for decades. Why are these ideas taking off now?

->
Rất nhiều những ý tưởng của deep learning (mạng neural) đã xuất hiện từ hàng thập kỷ trước. Vậy tại sao tận bây giờ chúng mới cất cánh, mới bùng nổ như vậy?
Copy link
Contributor

@tiepvupsu tiepvupsu Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Hai dấu khoảng trắng sau chấm câu
  • Câu thứ hai dịch gọn "Vậy tại sao tới bây giờ chúng mới bùng nổ như vậy?"

chapters/ch04.md Outdated


Two of the biggest drivers of recent progress have been:

->
Hai nguyên nhân mang tính quyết định tới những phát triển gần đây của deep learning là
Copy link
Contributor

@tiepvupsu tiepvupsu Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Thiếu dấu hai chấm.

chapters/ch04.md Outdated


* **Data availability.​** People are now spending more time on digital devices (laptops, mobile devices). Their digital activities generate huge amounts of data that we can feed to our learning algorithms.

->
**Dữ liệu sẵn có**. Ngày nay, mọi người dành nhiều thời gian hơn bên những thiết bị số như máy tính xách tay, thiết bị di động, .v.v. Chính những thiết bị số này là nguồn tạo ra lượng dữ liệu cực lớn - dữ liệu vẫn dùng cho những thuật toán học máy ngày nay.
Copy link
Contributor

@tiepvupsu tiepvupsu Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Hai dấu cách sau dấu phẩy.
  • "... lượng dữ liệu cực lớn cho các thuật toán học.". Không có chữ 'máy' nào ở đây. Nếu có thì mình cần giữ nguyên cụm 'machine learning.

chapters/ch04.md Outdated
* **Computational scale.** ​We started just a few years ago to be able to train neural networks that are big enough to take advantage of the huge datasets we now have.

->
**Quy mô năng lực tính toán**. Mãi mấy năm gần đây chúng ta mới có thể huấn luyện mạng neural đủ lớn để tận dụng được lượng dữ liệu big data.
Copy link
Contributor

@tiepvupsu tiepvupsu Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "Cho tới một vài năm gần đây..."
  • "tận dụng những bộ dữ liệu khổng lồ này".

chapters/ch04.md Outdated

In detail, even as you accumulate more data, usually the performance of older learning algorithms, such as logistic regression, “plateaus.” This means its learning curve “flattens out,” and the algorithm stops improving even as you give it more data:

->
Cho dù có thêm nhiều nhiều dữ liệu nữa, thì hiệu quả của thuật toán machine learning thế hệ cũ như hồi quy logistic cũng không tăng. Nghĩa là đồ thị tiến trình học những lại và thuật toán ngừng cải thiện cho dù có thêm dữ liệu.
Copy link
Contributor

@tiepvupsu tiepvupsu Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Bỏ chữ "thì"
  • "chững lại " thay vì "những lại".
  • Hình như mình thống nhất dịch "learning curve'" là "quá trình học" ở đâu đó.
  • Dấu hai chấm cuối cùng.

chapters/ch04.md Outdated


If you train a small neutral network (NN) on the same supervised learning task, you might get slightly better performance:

->
Nếu bạn huấn luyện một mạng neural nhỏ cho cùng một tác vụ học có kiểm soát thì có thể sẽ đạt chất lượng cao hơn một chút:
Copy link
Contributor

@tiepvupsu tiepvupsu Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "học có giám sát"
  • "có thể sẽ đạt"

chapters/ch04.md Outdated


Many other details such as neural network architecture are also important, and there has been much innovation here. But one of the more reliable ways to improve an algorithm’s performance today is still to (i) train a bigger network and (ii) get more data.

->
Còn nhiều chủ đề quan trọng khác như kiến trúc mạng neural. Phần lớn những sáng tạo và công trình nghiên cứu đều tập trung ở đây. Nhưng suy cho cùng, cách đơn giản, hiệu quả và tin cậy để tăng chất lượng thuật toán vẫn là (i) huấn luyện mạng lớn hơn trên (ii) tập dữ liệu lớn hơn.
Copy link
Contributor

@tiepvupsu tiepvupsu Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "trên và (ii)..."

chapters/ch04.md Outdated
@@ -68,10 +79,11 @@ Many other details such as neural network architecture are also important, and t
[1] This diagram shows NNs doing better in the regime of small datasets. This effect is less consistent than the effect of NNs doing well in the regime of huge datasets. In the small data regime, depending on how the features are hand-engineered, traditional algorithms may or may not do better. For example, if you have 20 training examples, it might not matter much whether you use logistic regression or a neural network; the hand-engineering of features will have a bigger effect than the choice of algorithm. But if you have 1 million examples, I would favor the neural network.

->

[1] Mặc dù hình vẽ cho thấy mạng neural cho kết quả tốt hơn với dữ liệu huấn luyện nhỏ, nhưng nhận định này ít đồng thuận hơn với nhận định về dùng mạng neural với dữ liệu huấn luyện lớn. Vì đối với dữ liệu nhỏ, chất lượng thuật toán truyền thống có thể hoặc không cho kết quả tốt hơn mạng neural và bị phụ thuộc rất nhiều vào cách tạo đặc trưng thủ công. Nếu ta chỉ có 20 mẫu huấn luyện thì không đủ để dùng cả hồi suy logistic lẫn mạng neural. Nhưng đồng thời, đặc trưng thủ công bị phụ thuộc nhiều vào thuật toán học máy. Còn nếu có một triệu mẫu, thì tôi sẽ chọn dùng mạng neural.
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Đoạn "không đủ dùng cả hồi squy logistic lẫn mạng neural..." không chuẩn. Chuẩn hơn là "Nếu chỉ có 20 mẫu huấn luyện thì việc dùng hồi quy logistic hay mạng neural không có nhiều khác biệt; việc xây dựng đặc trưng thủ công sẽ mang lại hiệu quả lớn hơn việc chọn thuật toán. Nhưng nếu có một triệu mẫu, tôi sẽ chọn mạng neural.".

chapters/ch04.md Outdated


The process of how to accomplish (i) and (ii) are surprisingly complex. This book will discuss the details at length. We will start with general strategies that are useful for both traditional learning algorithms and neural networks, and build up to the most modern strategies for building deep learning systems.

->
Quá trình hoàn thiện (i) huấn luyện mạng to hơn trên (ii) tập dữ liệu lớn hơn có thể phức tạp hơn bạn tưởng. Nhưng đừng lo, vấn đề này sẽ được thảo luận đầy đủ và chi tiết trong cuốn sách này. Nhưng trước tiên, chúng ta sẽ bắt đầu bằng các chiến thuật chung hữu ích cả cho thuật toán truyền thống lẫn mạng neural, và từ từ xây dựng chiến thuật mới nhất để xây dựng các hệ thống deep learning.
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

-> "Quá trình đạt được (i) một mạng lớn hơn và (ii) nhiều dữ liệu hơn phức tạp hơn chúng ta tưởng...."

Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "strategy" em nghĩ nên là chiến lược, cuốn sách này muốn nói đến chiến lược kiểu hoạch định từ đầu tới cuối làm những gì, còn chiến thuật thì hẹp hơn. Khi đã có chiến lược thì mới áp dụng chiến thuật để giải quyết vấn đề.
  • "từ từ" may be là "và từng bước xây dựng lên"
  • "the most modern" em nghĩ là không chỉ mới nhất mà còn hiện đại nhất (áp dụng những kỹ thuật mới nhất)

Copy link
Contributor Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Chiến lược có vẻ hợp hơn (y)
    < Chiến lượclà một tập hợp các lựa chọn được sử dụng để đạt được mục tiêu tổng thể trong khi chiến thuật là những hành động cụ thể được sử dụng khi áp dụng những lựa chọn chiến lược đó.
  • Và từng bước xây dựng (không cần lên)
  • the most modern --> ok.

chapters/ch04.md Outdated


Many other details such as neural network architecture are also important, and there has been much innovation here. But one of the more reliable ways to improve an algorithm’s performance today is still to (i) train a bigger network and (ii) get more data.

->
Còn nhiều chủ đề quan trọng khác như kiến trúc mạng neural. Phần lớn những sáng tạo và công trình nghiên cứu đều tập trung ở đây. Nhưng suy cho cùng, cách đơn giản, hiệu quả và tin cậy để tăng chất lượng thuật toán vẫn là (i) huấn luyện mạng lớn hơn và (ii) tập dữ liệu lớn hơn.
Copy link

@thanhnd0101 thanhnd0101 Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "Phần lớn những sáng tạo và công trình nghiên cứu đều tập trung ở đây" -> ", và đã có rất nhiều sáng tạo trong những chủ đề đó", câu này theo em nghĩ là nó liên quan đến "những chủ đề quan trọng", ý là "có nhiều chủ đề quan trọng ... và đã có rất nhiều sáng tạo trong những chủ đề đó".

  • "Nhưng suy cho cùng, cách đơn giản, hiệu quả và tin cậy" -> "Nhưng một trong những cách đáng tin cậy hơn", câu này em nghĩ nên dịch đơn giản sẽ dễ thể hiện cho người đọc..

  • "chất lượng thuật toán" -> "hiệu quả thuật toán" sẽ đúng hơn. Vì theo wiki dịch " Chất lượng là sự phù hợp với nhu cầu", "Hiệu quả là khả năng tạo ra kết quả mong muốn hoặc khả năng sản xuất ra sản lượng mong muốn."

  • "(ii) tập dữ liệu lớn hơn. " -> "(ii) thu thập tập dữ liệu lớn hơn", ở đây em nghĩ get more data là một vấn đề đi thu thập dữ liệu.

Copy link
Contributor Author

@ngcthuong ngcthuong Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Hiệu quả thường hiểu theo nghĩa "efficiency" trong tiếng anh nên mình nghĩ không chuẩn với nghĩa "performance". Vì efficiency bao gồm cả chất lượng dự đoán cũng như kích thước và độ phức tạp. Và ở đây, tăng kích thước mạng và data chỉ tăng chất lượng chứ không tăng "hiệu quả".

Mấy ý khác mình ok.

Copy link
Contributor Author

@ngcthuong ngcthuong Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • Còn nhiều chủ đề quan trọng khác, như kiến trúc mạng neural, với rất nhiều sáng tạo và công trình nghiên cứu

  • và (ii) lấy thêm dữ liệu.

chapters/ch04.md Outdated
@@ -68,10 +79,11 @@ Many other details such as neural network architecture are also important, and t
[1] This diagram shows NNs doing better in the regime of small datasets. This effect is less consistent than the effect of NNs doing well in the regime of huge datasets. In the small data regime, depending on how the features are hand-engineered, traditional algorithms may or may not do better. For example, if you have 20 training examples, it might not matter much whether you use logistic regression or a neural network; the hand-engineering of features will have a bigger effect than the choice of algorithm. But if you have 1 million examples, I would favor the neural network.

->

[1] Mặc dù hình vẽ thể hiện mạng neural cho kết quả tốt hơn với tập dữ liệu nhỏ, nhưng nhận định này ít đồng thuận hơn so với nhận định về mạng neural với dữ liệu lớn. Vì đối với dữ liệu nhỏ, chất lượng thuật toán truyền thống có thể hoặc không cho kết quả tốt hơn mạng neural và bị phụ thuộc rất nhiều vào cách tạo đặc trưng thủ công. Nếu ta chỉ có 20 mẫu huấn luyện thì việc dùng hồi quy logistic hay mạng neural không khác biệt nhiều. Nhưng đồng thời, đặc trưng thủ công bị phụ thuộc nhiều vào thuật toán học máy. Còn nếu có một triệu mẫu, thì tôi sẽ chọn dùng mạng neural.
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Từ 'consistent' dịch là 'nhất quán' thì đúng hơn; 'đồng thuận' gần với 'agree'. 'effect' cũng không phải là 'nhận định'. Hai câu đầu khá khó dịch, tớ đang nghĩ xem có cách nào hay hơn và chuẩn hơn không.

Chỗ " a neural network; the hand-engineering of features will have a bigger effect than the choice of algorithm." không nên tách ra làm hai câu vì nghĩ bị thay đổi. Tớ đề xuất dịch như lần trước tớ nói:

"không khác biệt nhiều; việc chọn đặc trưng thủ công sẽ mang lại nhiều sự khác biệt hơn".

chapters/ch04.md Outdated


The process of how to accomplish (i) and (ii) are surprisingly complex. This book will discuss the details at length. We will start with general strategies that are useful for both traditional learning algorithms and neural networks, and build up to the most modern strategies for building deep learning systems.

->
Quá trình đạt được (i) huấn luyện mạng lớn trên (ii) tập dữ liệu lớn có thể phức tạp hơn bạn tưởng. Nhưng đừng lo, vấn đề này sẽ được thảo luận đầy đủ và chi tiết trong cuốn sách này. Nhưng trước tiên, chúng ta sẽ bắt đầu bằng các chiến thuật chung, hữu ích cho cả thuật toán truyền thống lẫn mạng neural, và từ từ xây dựng chiến thuật mới cho việc xây dựng các hệ thống deep learning.
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

"Nhưng trước tiên, cChúng ta sẽ ....": Lặp từ "Nhưng" và "trước tiên" = "bắt đầu".

Copy link
Contributor Author

@ngcthuong ngcthuong Oct 21, 2019

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Review lại hộ cái tiêu đề phát.

Scale drives machine learning progress

Mình nghĩ từ progress ở đây ám chỉ tới mô hình machine learning nên mình dịch thẳng ra là Quy mô quyết định mô hình machine learning
thay vì Quy mô quyết định tiến trình machine learning

Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

:+1 Quy mô quyết định mô hìh machine learning

chapters/ch04.md Outdated

Cho dù có thêm nhiều nhiều dữ liệu nữa, hiệu quả của thuật toán machine learning thế hệ cũ như hồi quy logistic cũng không tăng. Nghĩa là đồ thị tiến trình học chững lại và thuật toán ngừng cải thiện cho dù có thêm dữ liệu:
Copy link
Contributor

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

  • "learning curve" = "quá trình học" như trong glossary.

@tiepvupsu tiepvupsu merged commit 965f3db into master Oct 21, 2019
@tiepvupsu tiepvupsu mentioned this pull request Oct 22, 2019
@ngcthuong
Copy link
Contributor Author

Các bạn có thêm comments thì tối mình sẽ tạo lại pull request để cập nhật thêm

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
high priority Cần được hoàn thành sớm review wanted Pull Request cần được review sớm
Projects
None yet
Development

Successfully merging this pull request may close these issues.

7 participants