Luận Văn Một số phương pháp khai phá dữ liệu quan hệ trong tài chính và chứng khoán

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Nhu Ely, 9/12/13.

  1. Nhu Ely

    Nhu Ely New Member

    Bài viết:
    1,771
    Được thích:
    1
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỤC LỤC
    MỞ ĐẦU . 4
    Chương 1. GIỚI THIỆU CHUNG . 7
    1.1. Bài toán dự báo 7
    1.2. Dữ liệu chuỗi thời gian 9
    1.2.1. Khái niệm chuối thời gian thực . 10
    1.2.2. Thành phần xu hướng dài hạn . 10
    1.2.3. Thành phần mùa 11
    1.2.4. Thành phần chu kỳ 11
    1.2.5. Thành phần bất thường 12
    CHƯƠNG 2. MÔ HÌNH ARIMA VÀ PHẦN MỀM EVIEWS . 13
    2.1. Mô hình ARIMA 13
    2.1.1. Hàm tự tương quan ACF 13
    2.1.2. Hàm tự tương quan từng phần PACF 14
    2.1.3. Mô hình AR(p) 17
    2.1.4. Mô hình MA(q) . 17
    2.1.5. Sai phân I(d) . 18
    2.1.6. Mô hình ARIMA 18
    2.1.7.Các bước phát triển mô hình ARIMA . 22
    2.2. Phần mềm ứng dụng Eviews 22
    2.2.1. Giới thiệu Eviews 22
    2.2.2. Áp dụng Eviews thi hành các bước mô hình ARIMA . 27
    Tóm tắt chương 2 29
    Chương 3. ÁP DỤNG MÔ HÌNH ARIMA VÀO BÀI TOÁN TÀI CHÍNH, CHỨNG KHOÁN . 30
    3.1. Mô hình ARIMA cho dự báo tài chính, chứng khoán 30
    3.1.1. Dữ liệu tài chính 30
    3.1.2. Mô hình ARIMA cho bài toán dự báo tài chính . 30
    3.1.3. Thiết kế mô hình ARIMA cho dữ liệu . 31
    3.2. Áp dụng 33
    3.2.1. Môi trường thực nghiêm 33
    3.2.2.Dữ liệu . 33
    3.2.3.Kiểm tra tính dừng của chuỗi chứng khoán AAM . 34
    3.2.4.Nhận dạng mô hình . 35
    3.2.5.Ước lượng và kiểm định với mô hình ARIMA . 37
    3.2.6Thực hiện dự báo 38
    KẾT LUẬN .

    Chương 1. GIỚI THIỆU CHUNG
    1.1. Bài toán dự báo
    Sự phát triển của công nghệ thông tin và việc ứng dụng công nghệ thông tin
    trong nhiều lĩnh vực của đời sống, kinh tế xã hội trong nhiều năm qua cũng đồng nghĩa
    với lượng dữ liệu đã được các cơ quan thu thập và lưu trữ ngày một tích lũy nhiều lên.
    Họ lưu trữ các dữ liệu này vì cho rằng trong nó ẩn chứa những giá trị nhất định nào đó.
    Tuy nhiên, theo thống kê thì chỉ có một lượng nhỏ của những dữ liệu này (khoảng từ
    5% đến 10% ) là luôn được phân tích, số còn lại họ không biết sẽ phải làm gì hoặc có
    thể làm gì với chúng nhưng họ vẫn tiếp tục thu thập rất tốn kém với ý nghĩ lo sợ rằng
    sẽ có cái gì đó quan trọng đã bị bỏ qua sau này có lúc cần đến nó. Mặt khác, trong môi
    trường cạnh tranh, người ta ngày càng cần có nhiều thông tin với tốc độ nhanh để trợ
    giúp việc ra quyết định và ngày càng có nhiều câu hỏi mang tính chất định tính cần
    phải trả lời dựa trên một khối lượng dữ liệu khổng lồ đã có. Với những lý do như vậy,
    các phương pháp quản trị và khai thác cơ sở dữ liệu truyền thống ngày càng không đáp
    ứng được thực tế đã làm phát triển một khuynh hướng kỹ thuật mới đó là kỹ thuật phát
    hiện tri thức và khai phá dữ liệu (KDD – Knowledge Discovery and Data Mining).
    Kỹ thuật phát hiện tri thức và khai phá dữ liệu đã và đang được nghiên cứu, ứng
    dụng trong nhiều lĩnh vực khác nhau ở các nước trên thế giới, tại Việt Nam kỹ thuật
    này tương đối còn mới mẻ tuy nhiên cũng đang được nghiên cứu và dần đưa vào ứng
    dụng.
    Từ thủa xa xưa, những nhà tiên tri đã giữ một vị trí quan trọng trong cộng đồng.
    Khi văn minh nhân loại phát triển đã làm gia tăng các mối quan hệ phức tạp của các
    giai đoạn trong cuộc sống, con người có nhu cầu quan tâm đến tương lai của họ.
    Như trình bày trong [2, 3], kỹ thuật dự báo đã hình thành từ thế kỉ thứ 19, tuy
    nhiên dự báo có ảnh hưởng mạnh mẽ khi công nghệ thông tin phát triển vì bản chất mô
    phỏng của các phương pháp dự báo rất cần thiết sự hỗ trợ của máy tính. Đến năm
    những 1950, các lý thuyết về dự báo cùng với các phương pháp luận được xây dựng và
    phát triển có hệ thống.
    Dự báo là một nhu cầu không thể thiếu cho những hoạt động của con người trong
    bối cảnh bùng nổ thông tin. Dự báo sẽ cung cấp những cơ sở cần thiết cho các hoạch
    định, và có thể nói rằng nếu không có khoa học dự báo thì những dự định tương lai của
    con người vạch ra sẽ không có sự thuyết phục đáng kể.
    Trong công tác phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt ra là việc
    năm bắt tối đa thông tin về lĩnh vực dự báo. Thông tin ở đây có thể hiểu một cách cụ
    thể gồm : (1) các số liệu quá khứ của lĩnh vực dự báo, (2) diễn biến tình hình hiện
    trạng cũng như động thái phát triển của lĩnh vực dự báo và (3) đánh giá một cách đầy
    đủ nhất các nhân tố ảnh hưởng cả về định lượng lẫn định tính.
    Căn cứ vào nội dung phương pháp và mục đích của dự báo, người ta chia dự báo
    thành hai loại: Phương pháp định tính và phương pháp định lượng.
    Phương pháp định tính thường phụ thuộc rất nhiều vào kinh nghiệm của một hay
    nhiều chuyên gia trong lĩnh vực liên quan. Phương pháp này thường được áp dụng, kết
    quả dự báo sẽ được các chuyên gian trong lĩnh vực liên quan nhận xét, đánh giá và đưa
    ra kết luận cuối.
    Phương pháp định lượng sử dụng những dữ liệu quá khứ theo thời gian, dựa trên
    dữ liệu lịch sử để phát hiện chiều hướng vận động của đối tượng phù hợp với một mô
    hình toán học nào đó và đồng thời sử dụng mô hình đó làm mô hình ước lượng. Tiếp
    cận định lượng dựa trên giả định rằng giá trị tương lai của biến số dự báo sẽ phụ thuộc
    vào xu thế vận động của đối tượng đó trong quá khứ. Phương pháp dự báo theo chuỗi
    thời gian là một phương pháp định lượng.
    Phương pháp chuỗi thời gian sẽ dựa trên việc phân tích chuỗi quan sát của một
    biến duy nhất theo biến số độc lập là thời gian. Giả định chủ yếu là biến số dự báo sẽ
    giữ nguyên chiều hướng phát triển đã xảy ra trong quá khứ và hiện tại.
    Khóa luận tập trung nghiên cứu mô hình ARIMA để thực hiện phân tích dữ liệu
    chứng khoán hướng tới việc dự báo chứng khoán. Mô hình ARIMA (AutoRegressive
    Integrate Moving Average) do Box-Jenkins đề nghị năm 1976 [6, 11, 13], dựa trên mô
    hình tự hồi quy AR và mô hình trung bình động MA. ARIMA là mô hình dự báo định
    lượng theo thời gian, giá trị tương lai của biến số dự báo sẽ phụ thuộc vào xu thế vận
    động của đối tượng đó trong quá khứ. Mô hình ARIMA phân tích tính tương quan giữa
    các dữ liệu quan sát để đưa ra mô hình dự báo thông qua các giai đoạn nhận dạng mô
    hình, ước lượng các tham số từ dữ liệu quan sát và kiểm tra các tham số ước lượng để
    tìm ra mô hình thích hợp. Mô hình kết quả của quá trình trên gồm các tham số thể hiện
    mức độ tương quan trên dữ liệu, và được chọn để dự báo giá trị tương lai. Giới hạn độ
    tin cậy của dự báo được tính dựa trên phương sai của sai số dự báo.
     

    Các file đính kèm:

Đang tải...