Machine Learning là gì và tại sao nó lại đang thay đổi thế giới?

Ngày đăng: 05/08/2021   -    Cập nhật: 05/08/2022
Trong bài viết này, chúng ta hãy cùng tìm hiểu tất cả những gì cần biết về Machine Learning: định nghĩa, cách hoạt động, phân loại… bạn sẽ biết tất cả về Machine Learning và tác động mang tính cách mạng của nó trên mọi lĩnh vực của cuộc sống!

Machine Learning (hay Học máy) là một lĩnh vực khoa học, cụ thể hơn là một nhánh phụ của trí tuệ nhân tạo. Machine learning chủ yếu là để các thuật toán khám phá ra các “hình mẫu” (patterns), cụ thể là các hình mẫu lặp đi lặp lại, trong các bộ dữ liệu. Những dữ liệu này có thể là các con số, ký tự, hình ảnh, số liệu thống kê…

Bất kỳ thứ gì có thể lưu trữ dưới dạng kỹ thuật số có thể được sử dụng làm dữ liệu cho Machine Learning. Băng cách khám phá các hình mẫu trong dữ liệu, các thuật toán sẽ học hỏi và cải thiện hiệu suất của chúng khi thực thi một tác vụ nào đó.

Nói ngắn gọn hơn, các thuật toán Machine Learning tự động học cách thực hiện một tác vụ hay đưa ra các dự đoán từ dữ liệu và cải thiện hiệu nang của chúng qua thời gian. Một khi đã được rèn luyện, thuật toán có thể tìm ra được hình mẫu trong những dữ liệu mới.
 

Machine Learning hoạt động như thế nào ?


Sự phát triển của một mô hình Machine Learning dựa vào 4 bước cơ bản. Theo thông lệ, một nhà khoa học dữ liệu sẽ quản lý và giám sát quy trình này.
 
Bước đầu tiên đó là chọn và chuẩn bị một bộ dữ liệu để rèn luyện. Dữ liệu này sẽ được đưa cho các mô hình Machine Learning để học cách giải quyết bài toán theo như thiết kế của chúng.

Dữ liệu có thể được dán nhãn để cho mô hình biết được rằng nó cần xác định được những đặc điểm nào. Dữ liệu cũng có thể không được dán nhãn, và mô hình sẽ chỉ cần phải tự xác định và lấy ra các đặc điểm lặp đi lặp lại.

Dù thế nào đi nữa, dữ liệu cần phải được chuẩn bị, sắp xếp và làm sạch một cách cẩn thận. Nếu không, sự rèn luyện mô hình Machine Learning có thể sẽ bị sai lệch. Kết quả là các dự đoán trong tương lai của nó sẽ trực tiếp bị ảnh hưởng.
 
Bước thứ hai đó là chọn một thuật toán để chạy trên bộ dữ liệu rèn luyện. Loại thuật toán được sử dụng phụ thuộc vào loại, lượng dữ liệu rèn luyện và dạng bài toán cần được giải quyết.
 
Bước thứ ba là rèn luyện thuật toán. Đây là một quá trình lặp đi lặp lại. Các biến được chạy qua thuật toán, và các kết quả được so sánh với mục tiêu cần đạt được. Các “đối trọng” and và sai số có thể được điều chỉnh để tăng độ chính xác cho kết quả.

Các biến sau đó sẽ được thực thi lại cho đến khi thuật toán đa số cho ra các kết quả đạt chuẩn. Thuật toán được rèn luyện theo cách này được gọi là Mô hình Machine Learning.
 
Bước thứ tư và là bước cuối cùng đó là sử dụng và cải thiện mô hình. Mô hình được sử dụng trên dữ liệu mới, nguồn dữ liệu phụ thuộc vào bài toán cần được giải quyết.

 
Ví dụ, một mô hình Machine Learning được thiết kế để phát hiện thư rác trong các email hay mô hình Machine Learning của một con robot hút bụi nhập vào các dữ liệu từ các tương tác với thế giới thực như khi di chuyển đồ đạc hay thêm các vật dụng mới vào trong phòng. Hiệu năng và độ chính xác có thể được cải thiện qua thời gian.
 

Các thuật toán chính của Machine Learning ?


Có rất nhiều loại thuật toán được sử dụng cho Machine Learning. Tuy nhiên, có một số thuật toán sẽ phổ biến hơn các thuật toán khác. Và trước hết, có các thuật toán khác nhau được sử dụng cho dữ liệu được dán nhãn.
 
Thuật toán hồi quy, tuyến tính hoặc logistic, được sử dụng để hiểu về các mối quan hệ trong dữ liệu.

Hồi quy tuyến tính được sử dụng để dự đoán giá trị dủa một biến phụ thuộc dựa trên giá trị của một biến độc lập. Ví dụ như để dự đoán doanh số hàng năm của một nhân viên bán hàng dựa trên trình độ học vấn và kinh nghiệm làm việc của họ.

Hồi quy Logistic được sử dụng khi các biến phụ thuộc là dạng nhị phân. Một loại thuật toán hồi quy nữa đó là máy vector hỗ trợ (support vector machine) phù hợp khi biến phụ thuộc khó phân loại.
 
Một thuật toán Machine Learning phổ biến khác đó là Cây ra quyết định. Thuật toán này cho phép lập ra các gợi ý dựa trên dựa trên một bộ các quy tắc ra quyết định sử dụng dữ liệu đã được phân loại.

 
Ví dụ, có khả năng đưa ra gợi ý nên đặt cược vào đội bóng nào dựa trên dữ liệu như tuổi của các cầu thủ hay tỷ lệ trận thắng của đội.

Với các dữ liệu chưa được gắn thẻ, thuật toán cụm thường được sử dụng. Phương pháp này xác định các nhóm với các thông số ghi được tương đồng và dán nhãn các thông số này vào thành các nhóm.

Trước đó, các nhóm và đặc tính của chúng là chưa được đến biết. Các thuật toán cụm bao gồm K-means, TwoStep hoặc Kohonen.
 
Các thuật toán kết hợp cho phép khám phá các hình mẫu và và các mối quan hệ trong dữ liệu, và cách xác định mối quan hệ  “if / then” được gọi là các “quy tắc kết hợp”. Các quy tắc này tương tự như các quy tắc sử dụng trong việc đào dữ liệu.
 
Cuối cùng, mạng thần kinh là các thuật toán có dạng một mạng lưới đa lớp. Lớp đầu tiên là nhập vào dữ liệu, một hay nhiều các lớp ẩn rút ra các kết luận từ dữ liệu được nhập vào, và lớp cuối cùng gán một xác suất xảy ra cho mỗi kết luận.

Một mạng thần kinh “sâu” được cấu tạo bởi nhiều lớp ẩn, mỗi lớp sẽ tinh lọc các kết quả của lớp trước đó. Nó được sử dụng trong lĩnh vực Deep Learning (Học sâu).
 

Deep Learning là gì ?

Deep Learning là một tập con của Machine Learning, nhưng lại được ứng dụng rộng rãi hơn cả. Đây là một phát minh của Geoffrey Hinton vào năm 1986.

Về cơ bản, Deep Learning là một phiên bản tăng cường của Machine Learning. Deep Learning sử dụng kỹ thuật cho phép khả năng tối ưu hơn để phát hiện ra dù là hình mẫu tinh vi nhất.

Kỹ thuật này được gọi là mạng thần kinh sâu (deep neural network). Độ sâu này tương ứng với các nút điện toán cấu tạo nên mạng lưới này và chúng làm việc hợp tác với nhau để xử lý dữ liệu và đưa ra các dự đoán.

Các mạng thần kinh này được lấy cảm hứng trực tiếp từ chức năng của não bộ con người. Các nốt điện toán tương ứng với các nơ-ron thần kinh, và hệ thống mạng tương đương với chính não bộ.
 

Có những loại Machine Learning nào ?

Có 3 kỹ thuật Machine Learning : học có giám sát (supervised learning), học không giám sát (unsupervised learning), và học củng cố (reinforcement learning). Đối với học có giám sát, là kỹ thuật phổ biến nhất, dữ liệu được dán nhãn để  máy biết được là nên tìm kiếm mẫu hình nào.

Hệ thống rèn luyện trên một bộ dữ liệu được dán nhãn, cùng với các thông tin mà nó phải xác định. Dữ liệu có thể đã được phân loại cùng với hệ thống.

Phương pháp này đòi hỏi ít dữ liệu rèn luyện hơn so với các phương pháp khác, và khiến cho quá trình rèn luyện dễ dàng hơn vì các kết quả của mô hình có thể được so sánh với các dữ liệu đã được dán nhãn. Tuy nhiên, dữ liệu được dán nhãn lại khá đắt đỏ. Một mô hình cũng có thể bị sai lệch bởi dữ liệu rèn luyện, và sẽ ảnh hưởng đến hiệu năng sau đó khi xử lý dữ liệu mới.
 
Trái lại, đối với học không giám sát, dữ liệu lại không được dán nhãn. Máy chỉ đơn giản là quét dữ liệu để tìm các mẫu hình có thể có. Nó nhập vào một lượng lớn dữ liệu, và sử dụng thuật toán để rút ra các đặc điểm phù hợp để dán nhãn, sắp xếp và phân loại dữ liệu trong thời gian thực mà không có sự can thiệp của con người.

Thay vì tự động hoá các quyết định và dự đoán, phương pháp này xác định các hình mẫu và các mối quan hệ mà con người có thể không xác định được trong dữ liệu. Kỹ thuật này không phổ biến bởi nó phức tạp hơn để áp dụng. Tuy nhiên, nó lại đang ngày càng trở nên phổ biến hơn trong lĩnh vực an ninh số.
 
Học nửa giám sát nằm ở giữa và trung hoà các đặc tính của học có giám sát và không giám sát. Trong quá trình rèn luyện, một bộ dữ liệu được dán nhãn nhỏ hơn được sử dụng để hướng dẫn việc phân loại và rút ra các đặc điểm từ từ một bộ dữ liệu chưa được dán nhãn lớn hơn.

Phương pháp này hữu ích khi dữ liệu được dán nhãn là không đủ để rèn luyện thuật toán có giám sát. Nó sẽ khắc phục được vấn đề của cả 2 phương pháp.
 
Cuối cùng đó là học củng cố, là để một thuật toán học hỏi từ những sai lầm của nó để đạt được mục đích. Thuật toán sẽ cố áp dụng nhiều phương pháp khác nhau để đạt mục tiêu đặt ra.

Dựa trên hiệu năng, nó sẽ được thưởng hoặc phạt để khuyến khích nó tiếp tục hoặc thay đổi phương pháp tiếp cận. Kỹ thuật này được sử đụng để cho phép AI có thể vượt qua con người trong các trò chơi.

 
Ví dụ, AlphaGo của Google đã đánh bại nhà vô địch cờ vây nhờ vào học củng cố. Tương tự, OpenAI đã rèn luyện một AI có khả năng đánh bại những game thủ Dota 2 giỏi nhất.
 

Các ứng dụng của Machine learning

Trong những năm gần đây, chúng ta đã nghe nói về nhiều tiến bộ trong lĩnh vực trí tuệ nhân tạo. Và với đó, các ứng dụng trí tuệ nhân tạo đang này càng tăng lên. Trên thực tế, phần lớn các tiến bộ trong lĩnh vực này đều liên quan trực tiếp đến Machine Learning.

Machine Learning được ẩn giấu sau một lượng lớn các dịch vụ công nghệ hiện đại đang phổ biến. Ví dụ như hệ thống gợi ý của Netflix, YouTubeSpotify sử dụng công nghệ này.

Tương tự đối với công cụ tìm kiếm trên web của Google và Baidu, trang news feed của các mạng xã hội như Facebook và Twitter, hay các trợ lý ảo như Siri và Alexa. Vì vậy, Machine Learning có thể được coi là tiến bộ công nghệ hàng đầu của đầu thế kỷ 21st.

Đó là lý do tại sao các nền tảng được nhắc đến ở trên và các gã khổng lồ về web khác thu thập một lượng lớn dữ liệu về người dùng như: thể loại phim ưa thích, các đường link mà bạn click vào, các thông tin công khai mà bạn có phản ứng… tất cả các dữ liệu này sẽ được đưa cho thuật toán Machine Learning và cho phép nó dự đoán những gì bạn muốn.

Machine Learning cũng cho phép các robot hút bụi có thể tự động làm sạch, hòm thư của bạn phát hiện ra thư rác, và hệ thống phân tích hình ảnh y khoa để giúp bác sĩ phát hiện khối u một cách hiệu quả. Công nghệ xe tự hành cũng được dựa vào machine learning.

Trợ lý ảo, chẳng hạn như Apple Siri, Amazon Alexa hay Google Assistant, dựa vào công nghệ Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).

Đây là một ứng dụng Machine Learningcho phép các máy vi tính xử lý dữ liệu giọng nói hoặc văn bản để “hiểu” ngôn ngữ con người. Công nghệ này cũng được ứng dụng cho hệ thống GPS hoặc Chatbot và các phần mềm chuyển giọng nói thành văn bản (speech-to-text).
 
Với sự phát triển không ngừng của Big Data, ngày càng có nhiều dữ liệu được tạo ra, và khi các công nghệ điện toán càng trở nên mạnh mẽ hơn, Machine Learning sẽ ngày càng mở ra nhiều khả năng hơn nữa cho con người trong tương lai.

Bình luận Facebook
Mục lục
Đăng ký tư vấn
Nhân viên gọi điện tư vấn miễn phí sau khi đăng ký
Được cập nhật các ưu đãi sớm nhất
Hotline: 0383180086
Tên không được để trống
Số điện thoại không được để trống
Email không được để trống
Hãy đăng ký để nhận những thông tin mới nhất về học bổng mới nhất tại NIIT - ICT Hà Nội
top
Đóng lại Đăng ký học tại NIIT - ICT Hà Nội
6260+ học viên đã theo học tại NIIT - ICT Hà Nội và có việc làm tốt trong ngành lập trình. Nắm lấy cơ hội ngay hôm nay!
Chọn khóa học
  • KHÓA HỌC LẬP TRÌNH FRONT END VỚI REACT.JS
  • KHÓA HỌC LẬP TRÌNH PHP WEB
  • Khóa học PHP Full stack [2023] cho người mới bắt đầu
  • Khóa học BIG DATA với Hadoop và Spark
  • Khóa học Lập trình Android tại Hà Nội
  • [Tuyển sinh 2023] Lập trình viên Quốc tế DigiNxt
  • Khóa học Tiền lương & Phúc lợi (C&B Excel) tại Hà Nội
  • LẬP TRÌNH GAME
    • Khóa học Lập trình Game Unity
  • LẬP TRÌNH WEB FRONT END
    • KHÓA HỌC PYTHON HƯỚNG ĐỐI TƯỢNG
    • KHÓA HỌC ANGULAR & TYPESCRIPT (FRONT END)
  • LẬP TRÌNH WEB BACK END
    • LẬP TRÌNH JAVA WEB VỚI FRAME WORK
    • Lập trình Web với Django
    • Lập trình PHP với Laravel Framework
  • CHƯƠNG TRÌNH ĐÀO TẠO ỨNG DỤNG CÔNG NGHỆ
    • Khóa học Tiền lương & Phúc lợi (C&B Excel) tại TP HCM
  • LẬP TRÌNH WEB FULL STACK
    • Khóa học Java Full stack (IJFD)
  • LẬP TRÌNH MOBILE
    • FRONT-END VỚI REACTJS VÀ REACT NATIVE
    • Lập trình Android Nâng cao
  • ĐÀO TẠO CHO DOANH NGHIỆP
    • KHÓA HỌC BUSINESS ANALYSIC TỪ CƠ BẢN ĐẾN NÂNG CAO 2023
    • Khóa học Magento: Làm chủ CMS TMĐT lớn nhất
    • Khóa học IOT: Xây dựng Sản phẩm IOT với Raspberry Pi
    • Khóa học Automation Testing Chuyên nghiệp
  • KHÓA HỌC DỰ ÁN
    • Học sử dụng bộ Office: Word, Excel, Power Point, Mail chuyên nghiệp
  • KHÓA HỌC KHÁC
    • VBA Excel Toàn Tập (Cơ Bản - Nâng Cao)
    • VBA Excel Nâng cao
    • Khóa học JMeter: Performance Testing
    • Khóa học Tester đạt chuẩn Quốc tế ISTQB Foundation Level
    • Khoá Học Tester đạt chuẩn quốc tế ISTQB Advanced Level
Bạn chưa chọn khóa học cần đăng ký
Tên không được để trống
Số điện thoại không được để trống
Email không được để trống
Đăng ký học thành công!
Cảm ơn bạn đã đăng ký học tại NIIT - ICT HÀ NỘI!