Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn

Trong bối cảnh dữ liệu nhiều chiều ngày càng trở nên phổ biến trong học máy, việc lựa chọn đặc trưng hiệu quả đóng vai trò then chốt trong việc xây dựng các mô hình phân lớp dữ liệu chính xác, đồng thời tối ưu hóa chi phí tính toán. Luận văn này đề xuất và phát triển hai mô hình lựa chọn đặc trung:...

Mô tả chi tiết

Lưu vào:
Hiển thị chi tiết
Tác giả chính: Vũ, Thị Kiều Anh
Đồng tác giả: Trịnh, Thành
Định dạng: Luận án
Ngôn ngữ:Vietnamese
Nhà xuất bản: Phenikaa University 2025
Chủ đề:
Truy cập trực tuyến:https://dlib.phenikaa-uni.edu.vn/handle/PNK/11656
Từ khóa: Thêm từ khóa
Không có từ khóa, Hãy là người đầu tiên đánh dấu biểu ghi này!
id oai:localhost:PNK-11656
record_format dspace
spelling oai:localhost:PNK-116562025-02-17T01:49:22Z Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn Vũ, Thị Kiều Anh Trịnh, Thành Khoa học máy tính Thuật toán Dữ liệu Trong bối cảnh dữ liệu nhiều chiều ngày càng trở nên phổ biến trong học máy, việc lựa chọn đặc trưng hiệu quả đóng vai trò then chốt trong việc xây dựng các mô hình phân lớp dữ liệu chính xác, đồng thời tối ưu hóa chi phí tính toán. Luận văn này đề xuất và phát triển hai mô hình lựa chọn đặc trung: Top Frequency-Based Feature Selection (TFFS) và Hybrid Feature Selection Paradigm. Mô hinh hybrid được thiết kế dựa trên kết quả từ TFFS như một giai đoạn nền tảng, sau đó kết hợp các kỹ thuật chọn lọc đặc trưng cổ điển để tạo ra các tập hợp con đặc trưng mạnh mẽ. Những tập hợp này được áp dụng vào bốn mô hình phân lớp phổ biến gồm Naive Bayes, Decision Tree, K-Nearest Neighbors và Support Vector Machine nhằm kiểm chứng hiệu quả của các đặc trưng được lựa chọn. Mục tiêu của các mô hình là giảm số lượng đặc trưng cần thiết trong khi vẫn xây dựng được các mô Minh phân lớp mạnh thể với độ chính xác cao. Kết quả thực nghiệm cho thấy, cả hai phương pháp đề xuất không chỉ vượt trội hơn các phương pháp truyền thống về độ chính xác mà còn giải quyết hiệu quả thách thức của dữ liệu nhiều chiều trong bài toán phân lớp. Đặc biệt, mô hình hybrid đã chứng minh tiềm năng ứng dụng rộng rãi trong các lĩnh vực như y học, tài chính, và phân tích dữ liệu lớn, đồng thời mở ra những hướng nghiên cứu mới trong việc lựa chọn đặc trưng và phân lớp dữ liệu phức tạp. 2025-02-17T01:49:22Z 2025-02-17T01:49:22Z 2025 Thesis https://dlib.phenikaa-uni.edu.vn/handle/PNK/11656 vi application/pdf Phenikaa University
institution Digital Phenikaa
collection Digital Phenikaa
language Vietnamese
topic Khoa học máy tính
Thuật toán
Dữ liệu
spellingShingle Khoa học máy tính
Thuật toán
Dữ liệu
Vũ, Thị Kiều Anh
Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn
description Trong bối cảnh dữ liệu nhiều chiều ngày càng trở nên phổ biến trong học máy, việc lựa chọn đặc trưng hiệu quả đóng vai trò then chốt trong việc xây dựng các mô hình phân lớp dữ liệu chính xác, đồng thời tối ưu hóa chi phí tính toán. Luận văn này đề xuất và phát triển hai mô hình lựa chọn đặc trung: Top Frequency-Based Feature Selection (TFFS) và Hybrid Feature Selection Paradigm. Mô hinh hybrid được thiết kế dựa trên kết quả từ TFFS như một giai đoạn nền tảng, sau đó kết hợp các kỹ thuật chọn lọc đặc trưng cổ điển để tạo ra các tập hợp con đặc trưng mạnh mẽ. Những tập hợp này được áp dụng vào bốn mô hình phân lớp phổ biến gồm Naive Bayes, Decision Tree, K-Nearest Neighbors và Support Vector Machine nhằm kiểm chứng hiệu quả của các đặc trưng được lựa chọn. Mục tiêu của các mô hình là giảm số lượng đặc trưng cần thiết trong khi vẫn xây dựng được các mô Minh phân lớp mạnh thể với độ chính xác cao. Kết quả thực nghiệm cho thấy, cả hai phương pháp đề xuất không chỉ vượt trội hơn các phương pháp truyền thống về độ chính xác mà còn giải quyết hiệu quả thách thức của dữ liệu nhiều chiều trong bài toán phân lớp. Đặc biệt, mô hình hybrid đã chứng minh tiềm năng ứng dụng rộng rãi trong các lĩnh vực như y học, tài chính, và phân tích dữ liệu lớn, đồng thời mở ra những hướng nghiên cứu mới trong việc lựa chọn đặc trưng và phân lớp dữ liệu phức tạp.
author2 Trịnh, Thành
author_facet Trịnh, Thành
Vũ, Thị Kiều Anh
format Thesis
author Vũ, Thị Kiều Anh
author_sort Vũ, Thị Kiều Anh
title Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn
title_short Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn
title_full Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn
title_fullStr Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn
title_full_unstemmed Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn
title_sort tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn
publisher Phenikaa University
publishDate 2025
url https://dlib.phenikaa-uni.edu.vn/handle/PNK/11656
_version_ 1824696201682878464
score 8.891787