Tiểu Luận Data mining - classification

Thúy Viết Bài · 5/12/13

MỞ ĐẦU
Sự phát triển nhanh chóng của mạng Internet và Intranet đã sinh ra một khối lượng khổng lồ các dữ liệu dạng siêu văn bản (dữ liệu Web). Cùng với sự thay đổi và phát triển hàng ngày, hàng giờ về nội dung cũng như số lượng các trang Web trên Internet thì vấn đề tìm kiếm thông tin đối với người sử dụng lại càng khó khăn. Có thể nói nhu cầu tìm kiếm thông tin trên một CSDL phi cấu trúc đã được phát triển chủ yếu cùng với sự phát triển của Internet. Thực vậy, với Internet con người đã làm quen với các trang Web cũng với vô vàn các thông tin. Trong những năm gần đây Internet đã trở thành một trong những kên về khoa học, thông tin kinh tế, thương mại và quảng cáo. Một trong những lý do cho sự phát triển này là sự thấp về giá cả tiêu tốn khi công khai một tran Web trên Internet. So sánh với những dịch vụ khác như mua bản hay quảng cáo trên một tờ báo hay tạp chí, thì một trang Web “đòi” rẻ hơn rất nhiều và cập nhật nhanh chóng hơn tới hàng triệu người dung khắp mọi nơi trên thế giới. Có thể nói trang Web như là cuốn từ điển Bách khoa toàn thư. Thông tin trên các trang Web đa dạng về mặt nội dung cũng như hình thức. Có thể nói Internet như một xã hội ảo, nó bao gồm các thông tin về mọi mặt của đời sống kinh tế, xã hội được trình bày dưới dạng văn bản, hình ảnh, âm thanh

Tuy nhiên cũng với sự đa dạng và số lượng lớn thông tin như vậy đã nảy sinh vấn đề quá tải thông tin. Người ta không thể tự tìm kiếm địa chỉ trang Web chứa thông tin mà mình cần, do vậy đòi hỏi phải có một trình tiện ích quản lý nội dung của các trang Web và cho phép tìm thấy các địa chỉ trang Web có nội dung giống với yêu cầu của người tìm kiếm. Các tiện ích này quản lý dữ liệu như các đối tượng phi cấu trúc. Hiện nay chúng ta đã làm quen với một số các tiện ích như vậy, đó là: yahoo, google, alvista
Mặt khác, giả sử chúng ta có các trang Web về các vấn đề Tin học, Thể thao, Kinh tế - Xã hội và xây dựng Căn cứ vào nội dung của các tài liệu mà khách hàng xem hoặc download về, sau khi phân lớp chúng ta sẽ biết khách hàng hay tập trung vào nội dung gì trên trang Web của chúng ta, từ đó chúng ta sẽ bổ sung thêm nhiều các tài liệu về các nội dung mà khách hàng quan tâm và ngược lại. Còn về phía khách hàng sau khi phân tích chúng ta cũng biết được khách hàng hay tập trung về vấn đề gì, từ đó có thể đưa ra những hỗ trợ thêm cho khách hàng đó. Từ những nhu cầu thực tế trên , phân lớp và tìm kiếm trang Web vẫn là bài toán hay và cần phát triển nghiên cứu hiện nay.

Tiểu Luận Data mining - classification

Thúy Viết Bài New Member
Thành viên vàng

Các file đính kèm:

96604144-data-mining-classification-.doc

Báo Cáo Datamining Khai phá dữ liệu

Báo Cáo Ứng dụng DataMining cho phát triển các thuê bao điện thọai cố định

Luận Văn Nghiên cứu datamining trong Microsoft sever 2005

Tiểu Luận Tiểu luận môn nghiên cứu một số thuật toán ứng dụng data mining

Luận Văn Nghiên cứu Data Mining trong Microsoft server 2005 với thuật toán Microsoft Association Rule và Micr

Tải tài liệu

Diễn đàn

Chứng nhận bảo mật

Theo dõi chúng tôi

Tìm kiếm hữu ích

Tiểu Luận Data mining - classification

Thúy Viết Bài New Member Thành viên vàng

Các file đính kèm:

96604144-data-mining-classification-.doc

Báo Cáo Datamining Khai phá dữ liệu

Báo Cáo Ứng dụng DataMining cho phát triển các thuê bao điện thọai cố định

Luận Văn Nghiên cứu datamining trong Microsoft sever 2005

Tiểu Luận Tiểu luận môn nghiên cứu một số thuật toán ứng dụng data mining

Luận Văn Nghiên cứu Data Mining trong Microsoft server 2005 với thuật toán Microsoft Association Rule và Micr

Thúy Viết Bài New Member
Thành viên vàng