Cách cài đặt Hadoop và Hướng dẫn cấu hình từng bước trên Ubuntu

Ngày đăng: 16/04/2019   -    Cập nhật: 16/04/2019

Trong bài hướng dẫn này, mình sẽ hướng dẫn bạn từng bước, từng bước để Cài đặt Apache Hadoop trên Linux box (Ubuntu).

  • Phần 1: Hướng dẫn từng bước Tải và cài đặt Hadoop
  • Phần 2: Hướng dẫn từng bước Cấu hình Hadoop

Hướng dẫn cài đặt và Config Hadoop

Hướng dẫn Cài đặt và Cấu hình Hadoop


Để làm được 2 phần này thì yêu cầu bạn phải:


1. Hướng dẫn từng bước tải và cài đặt Hadoop

  • Bước 1: Thêm hadoop system user bằng lệnh bên dưới

            
        

            
        

Nhập password, name và các thông tin khác của bạn.

LƯU Ý: Có khả năng xảy ra lỗi dưới đây trong quá trình cài đặt và cài đặt này.


"hduser is not in the sudoers file. This incident will be reported."
 
=> Lỗi này có thể được giải quyết bằng cách Đăng nhập với tư cách root user

>>> Tất cả các lỗi phát sinh sẽ được giải đáp đầy đủ và kỹ càng hơn trong Khóa học Big Data của NIIT - ICT Hà Nội.

Gõ lệnh sau:
            
        

Tiếp tục
            
        

  • Bước 2: Configure SSH

Để quản lý các Node trong một cụm, Hadoop yêu cầu truy cập SSH 

Đầu tiên, chúng ta chuyển user, bằng cách nhập lệnh sau:
            
        

Lệnh này sẽ tạo một key mới.
            
        

Cho phép truy cập SSH vào máy cục bộ bằng:
            
        

Bây giờ hãy kiểm tra thiết lập SSH bằng cách kết nối đến localhost với tư cách là người dùng 'hduser'.
            
        

Lưu ý: Nếu bạn thấy lỗi phản hồi lại là 'ssh localhost', thì có khả năng SSH không khả dụng trên hệ thống này.

Để giải quyết vấn đề này thì,

Lọc SSH bằng cách sử dụng lệnh:
            
        

Đó là một phương án tốt để lọc trước khi bắt đầu cài đặt.

Cài đặt SSH sử dụng lệnh
            
        

  • Bước 3: Tải Hadoop (Download Hadoop)


Bạn tải Hadoop tại đây
Hướng dẫn tải Hadoop

Hướng dẫn tải Hadoop

Hướng dẫn tải Hadoop - Chọn Stable

Hướng dẫn tải Hadoop - Chọn Stable

Hướng dẫn tải Hadoop - Chọn phiên bản tar.gz

Hướng dẫn tải Hadoop - Chọn phiên bản tar.gz


Khi quá trình tải xuống hoàn tất, bạn hãy điều hướng đến thư mục chứa tệp tar, bằng lệnh sau:
            
        

Bây giờ, đổi tên hadoop-3.2.0 thành hadoop
            
        

Tiếp tục sử dụng lệnh sau:

            
        

2: Hướng dẫn từng bước Cấu hình Hadoop (Configure Hadoop)

  • Bước 1: Sửa đổi file ~/.bashrc

Thêm các dòng sau vào cuối tệp ~/.bashrc
            
        

Bây giờ, cấu hình môi trường này bằng cách sử dụng lệnh dưới đây:
            
        

  • Bước 2: Các cấu hình liên quan đến HDFS

 Đặt JAVA_HOME trong tệp $HADOOP_HOME/etc/hadoop/hadoop-env.sh bằng cách:

Đổi export JAVA_HOME=${JAVA_HOME} ở trong file trên bằng:



            
        

Đến bước này, Có hai tham số trong $HADOOP_HOME/etc/hadoop/core-site.xml cần được thiết lập.

  1. "hadoop.tmp.dir": Tham số này được sử dụng để chỉ định một thư mục sẽ được Hadoop sử dụng để lưu trữ các tệp dữ liệu của nó.
  2. "fs.default.name": Tham số này chỉ định hệ thống tập tin mặc định.

Để thiết lập cho 2 tham số này, ta mở core-site.xml với lệnh sau:

            
        

Sao chép dòng bên dưới ở giữa các thẻ: <configuration></configuration>
            
        

Điều hướng đến thư mục $HADOOP_HOME/etc/Hadoop

Bây giờ, hãy tạo thư mục được đề cập trong core-site.xml
            
        

Cấp quyền cho thư mục
            
        

Tiếp tục
            
        

  • Bước 3: Hướng dẫn Cấu hình Map Reduce (Map Reduce Configuration)

Trước khi bạn bắt đầu với các cấu hình Map Reduce này, hãy thiết lập đường dẫn HADOOP_HOME
            
        

Sau đó
            
        

Tiếp tục gõ lệnh
            
        

Thoát Terminal và khởi động lại

Gõ echo $HADOOP_HOME để xác minh đường dẫn



            
        

Bây giờ hãy copy file
            
        

và mở tệp mapred-site.xml
            
        

Thêm dòng thiết lập bên dưới vào giữa các thẻ <configuration> và </configuration>
            
        

Mở $HADOOP_HOME/etc/hadoop/hdfs-site.xml như câu lệnh bên dưới:
            
        

Thêm các dòng cài đặt bên dưới giữa các thẻ <configuration> và </configuration>
            
        

Tạo một thư mục được chỉ định trong cài đặt ở trên:
            
        

            
        

            
        

            
        

            
        

            
        

  • Bước 4: Trước khi chúng ta khởi động Hadoop lần đầu tiên, hãy định dạng HDFS bằng lệnh bên dưới

            
        

  • Bước 5: Khởi động Hadoop Single Node Cluster bằng lệnh bên dưới

            
        

Chúng ta sẽ nhận được yêu cầu có chắc chắn tiếp tục (yes / no)? -> Chọn yes

Tiếp tục gõ lệnh:
            
        

Sử dụng 'jps' tool/command, xác minh xem tất cả các quy trình liên quan đến Hadoop có đang chạy hay không.


Nếu Hadoop đã khởi động thành công thì một output của jps sẽ hiển thị thông tin:

  • NameNode
  • NodeManager
  • ResourceManager
  • juniorNameNode
  • DataNode

  • Bước 6: Stop hadoop


Để tạm dừng Hadoop ta sử dụng lệnh sau:
            
        

và lệnh
            
        

Tổng kết

Như vậy là bạn đã biết cách từng bước Cài đặt HadoopCấu hình Hadoop trên Ubuntu. Nếu có bất kỳ lỗi gì trong quá trình cài đặt.

Hãy comment chi tiết vấn đề của bạn tại bài viết này để mình hỗ trợ nhé.
Bình luận Facebook
Đăng ký tư vấn
Nhân viên gọi điện tư vấn miễn phí sau khi đăng ký
Được cập nhật các ưu đãi sớm nhất
Hotline: 0383180086
Tên không được để trống
Số điện thoại không được để trống
Email không được để trống
Hãy đăng ký để nhận những thông tin mới nhất về học bổng mới nhất tại NIIT - ICT Hà Nội
top
Đóng lại Đăng ký học tại NIIT - ICT Hà Nội
6260+ học viên đã theo học tại NIIT - ICT Hà Nội và có việc làm tốt trong ngành lập trình. Nắm lấy cơ hội ngay hôm nay!
Chọn khóa học
  • KHÓA HỌC LẬP TRÌNH FRONT END VỚI REACT.JS
  • KHÓA HỌC LẬP TRÌNH PHP WEB
  • Khóa học PHP Full stack [2023] cho người mới bắt đầu
  • Khóa học BIG DATA với Hadoop và Spark
  • Khóa học Lập trình Android tại Hà Nội
  • [Tuyển sinh 2023] Lập trình viên Quốc tế DigiNxt
  • Khóa học Tiền lương & Phúc lợi (C&B Excel) tại Hà Nội
  • LẬP TRÌNH GAME
    • Khóa học Lập trình Game Unity
  • LẬP TRÌNH WEB FRONT END
    • KHÓA HỌC PYTHON HƯỚNG ĐỐI TƯỢNG
    • KHÓA HỌC ANGULAR & TYPESCRIPT (FRONT END)
  • LẬP TRÌNH WEB BACK END
    • LẬP TRÌNH JAVA WEB VỚI FRAME WORK
    • Lập trình Web với Django
    • Lập trình PHP với Laravel Framework
  • CHƯƠNG TRÌNH ĐÀO TẠO ỨNG DỤNG CÔNG NGHỆ
    • Khóa học Tiền lương & Phúc lợi (C&B Excel) tại TP HCM
  • LẬP TRÌNH WEB FULL STACK
    • Khóa học Java Full stack (IJFD)
  • LẬP TRÌNH MOBILE
    • FRONT-END VỚI REACTJS VÀ REACT NATIVE
    • Lập trình Android Nâng cao
  • ĐÀO TẠO CHO DOANH NGHIỆP
    • KHÓA HỌC BUSINESS ANALYSIC TỪ CƠ BẢN ĐẾN NÂNG CAO 2023
    • Khóa học Magento: Làm chủ CMS TMĐT lớn nhất
    • Khóa học IOT: Xây dựng Sản phẩm IOT với Raspberry Pi
    • Khóa học Automation Testing Chuyên nghiệp
  • KHÓA HỌC DỰ ÁN
    • Học sử dụng bộ Office: Word, Excel, Power Point, Mail chuyên nghiệp
  • KHÓA HỌC KHÁC
    • VBA Excel Toàn Tập (Cơ Bản - Nâng Cao)
    • VBA Excel Nâng cao
    • Khóa học JMeter: Performance Testing
    • Khóa học Tester đạt chuẩn Quốc tế ISTQB Foundation Level
    • Khoá Học Tester đạt chuẩn quốc tế ISTQB Advanced Level
Bạn chưa chọn khóa học cần đăng ký
Tên không được để trống
Số điện thoại không được để trống
Email không được để trống
Đăng ký học thành công!
Cảm ơn bạn đã đăng ký học tại NIIT - ICT HÀ NỘI!