Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn
Trong bối cảnh dữ liệu nhiều chiều ngày càng trở nên phổ biến trong học máy, việc lựa chọn đặc trưng hiệu quả đóng vai trò then chốt trong việc xây dựng các mô hình phân lớp dữ liệu chính xác, đồng thời tối ưu hóa chi phí tính toán. Luận văn này đề xuất và phát triển hai mô hình lựa chọn đặc trung:...
Lưu vào:
Tác giả chính: | |
---|---|
Đồng tác giả: | |
Định dạng: | Luận án |
Ngôn ngữ: | Vietnamese |
Nhà xuất bản: |
Phenikaa University
2025
|
Chủ đề: | |
Truy cập trực tuyến: | https://dlib.phenikaa-uni.edu.vn/handle/PNK/11656 |
Từ khóa: |
Thêm từ khóa
Không có từ khóa, Hãy là người đầu tiên đánh dấu biểu ghi này!
|
id |
oai:localhost:PNK-11656 |
---|---|
record_format |
dspace |
spelling |
oai:localhost:PNK-116562025-02-17T01:49:22Z Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn Vũ, Thị Kiều Anh Trịnh, Thành Khoa học máy tính Thuật toán Dữ liệu Trong bối cảnh dữ liệu nhiều chiều ngày càng trở nên phổ biến trong học máy, việc lựa chọn đặc trưng hiệu quả đóng vai trò then chốt trong việc xây dựng các mô hình phân lớp dữ liệu chính xác, đồng thời tối ưu hóa chi phí tính toán. Luận văn này đề xuất và phát triển hai mô hình lựa chọn đặc trung: Top Frequency-Based Feature Selection (TFFS) và Hybrid Feature Selection Paradigm. Mô hinh hybrid được thiết kế dựa trên kết quả từ TFFS như một giai đoạn nền tảng, sau đó kết hợp các kỹ thuật chọn lọc đặc trưng cổ điển để tạo ra các tập hợp con đặc trưng mạnh mẽ. Những tập hợp này được áp dụng vào bốn mô hình phân lớp phổ biến gồm Naive Bayes, Decision Tree, K-Nearest Neighbors và Support Vector Machine nhằm kiểm chứng hiệu quả của các đặc trưng được lựa chọn. Mục tiêu của các mô hình là giảm số lượng đặc trưng cần thiết trong khi vẫn xây dựng được các mô Minh phân lớp mạnh thể với độ chính xác cao. Kết quả thực nghiệm cho thấy, cả hai phương pháp đề xuất không chỉ vượt trội hơn các phương pháp truyền thống về độ chính xác mà còn giải quyết hiệu quả thách thức của dữ liệu nhiều chiều trong bài toán phân lớp. Đặc biệt, mô hình hybrid đã chứng minh tiềm năng ứng dụng rộng rãi trong các lĩnh vực như y học, tài chính, và phân tích dữ liệu lớn, đồng thời mở ra những hướng nghiên cứu mới trong việc lựa chọn đặc trưng và phân lớp dữ liệu phức tạp. 2025-02-17T01:49:22Z 2025-02-17T01:49:22Z 2025 Thesis https://dlib.phenikaa-uni.edu.vn/handle/PNK/11656 vi application/pdf Phenikaa University |
institution |
Digital Phenikaa |
collection |
Digital Phenikaa |
language |
Vietnamese |
topic |
Khoa học máy tính Thuật toán Dữ liệu |
spellingShingle |
Khoa học máy tính Thuật toán Dữ liệu Vũ, Thị Kiều Anh Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn |
description |
Trong bối cảnh dữ liệu nhiều chiều ngày càng trở nên phổ biến trong học máy, việc lựa chọn đặc trưng hiệu quả đóng vai trò then chốt trong việc xây dựng các mô hình phân lớp dữ liệu chính xác, đồng thời tối ưu hóa chi phí tính toán. Luận văn này đề xuất và phát triển hai mô hình lựa chọn đặc trung: Top Frequency-Based Feature Selection (TFFS) và Hybrid Feature Selection Paradigm. Mô hinh hybrid được thiết kế dựa trên kết quả từ TFFS như một giai đoạn nền tảng, sau đó kết hợp các kỹ thuật chọn lọc đặc trưng cổ điển để tạo ra các tập hợp con đặc trưng mạnh mẽ. Những tập hợp này được áp dụng vào bốn mô hình phân lớp phổ biến gồm Naive Bayes, Decision Tree, K-Nearest Neighbors và Support Vector Machine nhằm kiểm chứng hiệu quả của các đặc trưng được lựa chọn. Mục tiêu của các mô hình là giảm số lượng đặc trưng cần thiết trong khi vẫn xây dựng được các mô Minh phân lớp mạnh thể với độ chính xác cao. Kết quả thực nghiệm cho thấy, cả hai phương pháp đề xuất không chỉ vượt trội hơn các phương pháp truyền thống về độ chính xác mà còn giải quyết hiệu quả thách thức của dữ liệu nhiều chiều trong bài toán phân lớp. Đặc biệt, mô hình hybrid đã chứng minh tiềm năng ứng dụng rộng rãi trong các lĩnh vực như y học, tài chính, và phân tích dữ liệu lớn, đồng thời mở ra những hướng nghiên cứu mới trong việc lựa chọn đặc trưng và phân lớp dữ liệu phức tạp. |
author2 |
Trịnh, Thành |
author_facet |
Trịnh, Thành Vũ, Thị Kiều Anh |
format |
Thesis |
author |
Vũ, Thị Kiều Anh |
author_sort |
Vũ, Thị Kiều Anh |
title |
Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn |
title_short |
Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn |
title_full |
Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn |
title_fullStr |
Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn |
title_full_unstemmed |
Tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn |
title_sort |
tìm hiểu và triển khai các thuật toán phân lớp cho dữ liệu lớn |
publisher |
Phenikaa University |
publishDate |
2025 |
url |
https://dlib.phenikaa-uni.edu.vn/handle/PNK/11656 |
_version_ |
1824696201682878464 |
score |
8.891787 |