Luận Văn Nghiên cứu mạng thư điện tử và ứng dụng trong lọc thư rác

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    Mục lục
    LỜI CẢM ƠN 3
    MỞ ĐẦU . 8
    CHƯƠNG 1: TỔNG QUAN VỀ THƯ RÁC . 10
    1.1 Khái niệm thư rác 10
    1.1.1Thư rác là gì ? 10
    1.1.2Các đặc điểm của thư rác. .11
    1.1.3Phân loại thư rác .12
    1.1.4Những thiệt hại do thư rác gây ra 13
    1.2 Các giải pháp cho vấn đề lọc thư rác . 16
    1.2.1 Ban hành các bộ luật chống thư rác 16
    1.2.2 Các phương pháp lọc thư rác trước đây 16
    CHƯƠNG 2: KIẾN THỨC CƠ SỞ . 26
    2.1 Mạng phức hợp (Complex Networks) 26
    2.1.1 Độ dài đường dẫn trung bình .30
    2.1.2 Độ phân cụm 31
    2.1.3 Độ phân bố bậc 31
    2.2 Các mô hình của mạng phức hợp 33
    2.2.1Mạng cặp thông thường (Regular coupled networks) .33
    2.2.2Đồ thị ngẫu nhiên (Random Graphs) .34
    2.2.3Các mô hình Small-world 36
    2.2.4Các mô hình Scale-free 39
    2.3 Mạng xã hội (Social Networks) . 41
    2.4 Mạng thư điện tử (Email Networks) 43
    2.4.1 Mạng thư điện tử scale-free. .43
    2.4.2 Tính chất Small-world của mạng thư điện tử. .44
    2.4.3 Mạng thư điện tử là mạng có hướng 46
    2.4.4 Sự lan rộng của virus trong mạng thư điện tử .48
    2.4.5 Mạng thư điện tử khi bị spam tấn công .49

    CHƯƠNG 3: ỨNG DỤNG MẠNG THƯ ĐIỆN TỬ TRONG LỌC
    THƯ RÁC . 50
    3.2 Đề xuất phương pháp . 51
    3.3 Đặc điểm của phương pháp . 53
    CHƯƠNG 4: THỰC NGHIỆM TRÊN LOG FILES 55
    4.1 Đặc điểm dữ liệu 55
    4.2 Kết quả thực nghiệm và phân tích . 57
    4.3 Nhận xét 60
    KếT LUậN . 61

    MỞ ĐẦU
    Ngày nay cùng với sự toàn cầu hóa việc kết nối thông tin, thư điện tử (Email)
    đã trở thành một phần quan trọng trong đời sống và trong cả các hoạt động kinh doanh
    thương mại. Thư điện tử cho phép tiết kiệm thời gian và khắc phục mọi vấn đề về
    khoảng cách địa lí, về chi phí trong trao đổi thông tin liên lạc. Chính những thuận tiện
    trong trao đổi thư điện tử lại tạo ra một số sơ hở để cho các loại thư không mong muốn
    (thư rác: spam mail) hoạt động gây phiền toái cho người dùng. Trong một vài năm gần
    đây, những thư điện tử không mong muốn như vậy phát triển và gây ra không ít thiệt
    hại cho người dùng nói riêng và cho nền kinh tế - xã hội nói chung. Theo nhiều bản
    thống kê [10,15], thư rác đã chiếm tới ¾ tổng số thư điện tử lưu thông trên toàn thế
    giới. Có không ít người dùng đã hạn chế sử dụng thư điện tử như một phương tiện liên
    lạc, và điều đó đã gây ra sự trở ngại đáng kể cho liên lạc giữa các người dùng cũng
    như hạn chế việc phát sinh lợi nhuận chính đáng của nền kinh tế nhờ phương tiện liên
    lạc này.
    Hiện nay, thư rác đang là một trong những vấn đề nhức nhối của xã hội.
    Nhiều phương pháp, công cụ lọc thư rác đã được đề xuất, tuy nhiên nhìn chung các
    công cụ lọc thư rác hiện nay vẫn tỏ ra chưa thực sự hiệu quả. Chính vì lý do đó, nhiều
    hướng tiếp cận lọc thư rác mới đã được đề xuất [39], kể cả các hướng tiếp cận kết hợp
    các phương pháp khác nhau, trong đó hướng tiếp cận theo mạng xã hội là một trong
    các hướng nổi bật nhất. Ý thức được điều này, hướng nghiên cứu về các phương pháp
    lọc thư rác, tập trung theo hướng tiếp cận mạng thư điện tử đề tài của khóa luận với tên
    gọi "Nghiên cứu mạng thư điện tử và ứng dụng trong lọc thư rác".
    Khóa luận được tổ chức thành 4 chương như sau:
    Chương 1 giới thiệu tổng quan về thư rác và một số hướng tiếp cận điển hình
    trước đây trong việc lọc thư rác.
    Chương 2 trình bày về một số tính chất quan trọng của mạng phức hợp, mạng
    xã hội, mạng thư điện tử. Đây là cơ sở kiến thức để phát triển nội dung của khóa luận
    trong các chương sau.
    Chương 3 trình bày một phương pháp mới ứng dụng các tính chất của mạng
    thư điện tử vào vấn đề lọc thư rác thông qua việc tính hạng phân cụm của các địa chỉ
    thư. Các nội dung đề xuất được trình bày chi tiết trong chương này.
    Chương 4 trình bày về thực nghiệm tiến hành với logs file của máy chủ email
    tại Đại học Quốc gia Hà Nội. Kết quả thực nghiệm cho thấy địa chỉ thư với độ phân
    cụm thấp có khả năng cao là địa chỉ thư rác .
    Phần kết luận tổng kết các kết quả chủ yếu của khóa luận và phương hướng
    nghiên cứu tiếp theo để phát triển, cải tiến phương pháp mạng thư điện tử được đề xuất.
    Cho dù đã cố gắng song không thể tránh khỏi những sai sót, em rất mong
    được sự góp ý của thầy cô và các bạn.
     

    Các file đính kèm:

Đang tải...