Thạc Sĩ Xây dựng hệ thống GIR phục vụ tìm kiếm thông tin địa lý, vị trí ở Việt Nam

Thảo luận trong 'THẠC SĨ - TIẾN SĨ' bắt đầu bởi Nhu Ely, 9/12/13.

  1. Nhu Ely

    Nhu Ely New Member

    Bài viết:
    1,771
    Được thích:
    1
    Điểm thành tích:
    0
    Xu:
    0Xu
    LUẬN VĂN THẠC SĨ
    NĂM 2011



    Mục lục
    Mục lục . 1
    Danh mục hình ảnh 4
    Danh sách bảng biểu 6
    Giới thiệu 7
    Chương 1: Tổng quan về hệ thống truy vấn thông tin địa lý . 9
    1.1 Giới thiệu: . 9
    1.2 Các đặc điểm của thông tin địa lý: . 10
    1.3 Ảnh hưởng của các phương pháp nhận thức không gian: 12
    1.4 Vai trò của từ điển địa lý và Ontology: 14
    1.5 Tìm kiếm thông tin địa lý: 18
    1.6 Hệ thống truy vấn thông tin địa lý Việt Nam: 19

    Chương 2: Lập chỉ mục cho nội dung tài liệu . . 20
    2.1 Các phương pháp lập chỉ mục: . 20
    2.1.1 Phương pháp lập chỉ mục thuần theo nội dung (PT): 20
    2.1.2 Phương pháp 1 lập chỉ mục kết hợp nội dung - không gian (ST): 22
    2.1.3 Phương pháp 2 lập chỉ mục kết hợp nội dung - không gian (TS): 24
    2
    2.1.4 Phương pháp 3 lập chỉ mục kết hợp không gian – nội dung (T): 25
    2.1.5 So sánh, đánh giá các phương pháp: 26
    2.2 Lựa chọn mô hình lập chỉ mục cho hệ GIR Việt Nam: 31

    Chương 3: Phân tích câu truy vấn 32
    3.1 Giới thiệu: . 32
    3.2 Các khái niệm và công việc liên quan: . 33
    3.3 Phân tích các thành phần trong câu truy vấn: . 34
    3.4 Giải thuật phân tích các thành phần trong câu truy vấn: 36
    3.4.1 Xác định bộ ba <what, relation, where>: . 36
    3.4.2 Xác định ý nghĩa thành phần where: . 42
    3.4.3 Xác định ý nghĩa thành phần what: . 46
    3.5 Đánh giá các giải thuật: 50

    Chương 4: Tìm kiếm và xếp hạng kết quả . 55
    4.1 Giới thiệu: . 55
    4.2 Tìm kiếm: . 55
    4.2.1 Tìm kiếm theo vùng (Region-based Range Query): 57
    4.2.2 Tìm kiếm xung quanh điểm (Point-based Range Query): . 58
    4.2.3 Tìm kiếm theo đường (Path-based Range Query): 59
    4.2.4 Đánh giá phương pháp tìm kiếm theo đường: . 64
    4.3 Xếp hạng: 66
    4.3.1 Xếp hạng trong tìm kiếm theo vùng: . 67
    4.3.2 Xếp hạng trong tìm kiếm xung quanh điểm: . 68
    4.3.3 Xếp hạng trong tìm kiếm theo đường: . 69
    Chương 5: Tổng kết và hướng phát triển . 71
    5.1 Tổng kết: . 71
    5.2 Hướng phát triển: 71
    Tài liệu tham khảo 73
    Phụ lục 76

    Giới thiệu
    Với sự bùng nổ của thông tin ngày nay thì yêu cầu đặt ra là làm thế nào để tiếp cận
    được với thông tin một cách hiệu quả, nhanh chóng và tiện lợi nhất. Theo một nghiên
    cứu cho thấy, đa phần các thông tin tồn tại trên thế giới này đều ít nhiều có liên quan
    đến một nơi nào đó. Do đó, giới hạn địa lý trong tìm kiếm là một tiêu chuẩn giúp các
    máy tìm kiếm có thể trả ra những kết quả chính xác hơn, phù hợp hơn với yêu cầu tìm
    kiếm. Ví dụ một người muốn tìm các tài liệu về tình hình giáo dục ở Việt Nam, họ sẽ
    cảm thấy không hài lòng chút nào nếu trong các kết quả trả ra có những kết quả nói về
    tình hình giáo dục của Singapore hay bất kỳ một nơi nào khác. Nhằm giúp giải quyết
    tốt các dạng tìm kiếm liên quan đến vị trí địa lý như trên, các nhà khoa học trên thế
    giới nghĩ đến việc xây dựng một hệ thống truy vấn thông tin địa lý (Geographic
    Information Retrieval System – GIR System). Hệ thống truy vấn thông tin địa lý cũng
    chính là một hệ truy vấn thông tin (Information Retrieval - IR) thông thường, nó sẽ
    thực hiện các nhiệm vụ lập chỉ mục trên tài liệu, phân tích các câu truy vấn và tìm
    kiếm, xếp hạng kết quả sao cho phù hợp với yêu cầu từ phía người dùng nhưng sẽ dựa
    trên những đặc trưng của loại thông tin địa lý, của yếu tố không gian trong nội dung tài
    liệu, trong câu truy vấn, v.v
    Không nằm ngoài tầm ảnh hưởng chung của việc bùng nổ thông tin. Các thông tin liên
    quan đến Việt Nam, mang tính cục bộ ở từng vùng, miền của Việt Nam cũng tăng lên
    từng ngày. Tuy nhiên, theo khảo sát thì hiện ở Việt Nam chưa có một hệ thống GIR
    nào được xây dựng để phục vụ nhu cầu tìm kiếm thông tin liên quan đến vị trí địa lý
    như cách mà thế giới tiếp cận, hầu hết các dịch vụ cung cấp khả năng tìm kiếm thông
    tin ở Việt Nam đều chưa quan tâm đến yếu tố không gian trong truy vấn từ phía người
    dùng cũng như là yếu tố không gian trong nội dung thông tin. Trong khi đó, các hệ
    thống tìm kiếm thông tin địa lý đang làm việc rất hiệu quả như Google Maps (Google
    Local) hay Live Maps thì lại không thể phục vụ được người dùng Việt Nam do trở ngại
    về dữ liệu và sự khác biệt trong văn hóa ngôn ngữ. Với tình hình thực tế đó, luận văn
    này xin giới thiệu một số các giai đoạn quan trọng trong quá trính xây dựng một hệ
    thống GIR dùng cho Việt Nam, đồng thời tiến hành xây dựng hệ thống dựa trên những
    đặc trưng, kinh nghiệm, thói quen, nhận thức của người Việt Nam về thông tin địa lý
    và cách thức tìm kiếm thông tin liên quan đến vị trí, địa điểm thể hiện trong câu truy
    vấn. Phần tiếp theo của luận văn được trình bày theo cấu trúc như sau:

    Chương 1, luận văn sẽ trình bày sơ nét về hệ thống GIR cùng với những vấn đề sẽ gặp phải khi đi sâu
    vào nghiên cứu.
    Từ chương 2 đến chương 4 luận văn sẽ trình bày các giai đoạn chính,
    các vấn đề cũng như là các hướng tiếp cận để giải quyết vấn đề trong việc xây dựng hệ
    thống GIR cho Việt Nam, đó là các giai đoạn lập chỉ mục, xử lý câu truy vấn, tìm kiếm
    và xếp hạng kết quả, v.v
    Chương 5 sẽ tổng kết lại những gì luận văn đã làm được và
    định hướng nghiên cứu, phát triển tiếp theo trong tương lai.
     
Đang tải...