Thạc Sĩ Nghiên cứu một số kỹ thuật lấy tin tự động trên internet

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    Đề tài: NGHIÊN CỨU MỘT SỐ KỸ THUẬT LẤY TIN TỰ ĐỘNG TRÊN INTERNET


    Luận văn dài 72 trang

    Chương 1: KHÁI QUÁT VỀ KHAI PHÁ DỮ LIỆU VÀ
    PHÂN CỤM TÀI LIỆU WEB
    1.1 Khai phá dữ liệu:
    1.1.1 Các dạng dữ liệu
    1.1.2 Các bài toán thông dụng trong Khai phá dữ liệu
    1.1.3 Các môi trường khai phá dữ liệu
    1.1.4 Các ứng dụng của khai phá dữ liệu
    1.2. Phân cụm tài liệu và phân cụm tài liệu Web
    1.2.1 Khai phá dữ liệu Web
    1.2.2. Bài toán phân cụm tài liệu Web
    Chương 2: MỘT SỐ THUẬT TOÁN PHÂN CỤM TÀI LIỆU
    2.1. Phân cụm dữ liệu không gian và các tiếp cận
    2.1.1 Phân cụm phân hoạch
    2.1.2 Phân cụm dữ liệu phân cấp
    2.1.3 Phân cụm dữ liệu dựa trên mật độ
    2.1.8 Phân cụm dữ liệu dựa trên lưới
    2.1.9 Phân cụm dữ liệu dựa trên mô hình
    2.2. Phân cụm dữ liệu dựa vào thuật toán K-means
    2.2.1. Tư tưởng thuật toán
    2.2.2 Mô tả thuật toán
    2.3 Phân cụm dữ liệu dựa vào thuật toán K-medios
    2.3.1. Tư tưởng thuật toán
    2.3.2. Mô tả thuật toán
    2.3.3 Nhận xét:
    2.4. Phân cụm dữ liệu dựa vào thuật toán BIRCH
    2.4.1. Tư tưởng thuật toán
    2.4.2 Mô tả thuật toán:
    2.5. Cải tiến thuật toán K-means trong phân cụm dữ liệu tự động
    2.5.1. Tư tưởng thuật toán
    2.5.2. Mô tả thuật toán
    2.5.3 Nhận xét:
    2.3.4 Thử nghiệm:
    Chương 3: ỨNG DỤNG TRONG LẤY TIN TỰ ĐỘNG
    3.1. Bài toán Thu thập dữ liệu về kinh tế trên Internet
    3.1.1 iCA
    3.1.3 iGoogle
    3.1.4 Trình duyệt Firefox
    3.1.5 Tổng hợp yêu cầu của người dùng
    3.1.6 Đánh giá và lựa chọn giải pháp
    3.2 Phân tích chức năng hệ thống
    3.2.1 Biểu đồ Use Case
    3.2.2 Đặc tả các Use - case
    3.2.3 Biểu đồ tuần tự (Sequence Diagram)
    3.3 Thiết kế cơ sở dữ liệu
    3.3.1 Đặc tả chi tiết các bảng dữ liệu
    3.3.2 Mô hình quan hệ
    3.4 Qui trình tự động lấy đường dẫn tới tập tin RSS
    3.5 Qui trình đọc tập tin RSS
    Người dùng có thể nhập trực tiếp đường dẫn tới file RSS. Nhiệm vụ của
    hệ thống là trích rút dữ liệu từ file RSS. Để trích rút dữ liệu ta làm như sau:
    Bước 1: Trước tiên là thiết kế lớp RSSItem để chứa các dữ liệu mà ta
    trích rút từ file RSS.
    Bước 2: Đọc file RSS
    3.6 Một số màn hình giao diện đạt được
     
Đang tải...