Kho dữ liệu dành cho học máy
Chào mừng bạn đến với kho dữ liệu của AIcandy.vn – nguồn tài nguyên quý giá cho việc training AI và Machine Learning. Tại đây, chúng tôi cung cấp đa dạng các bộ dữ liệu (datasets) chất lượng cao, được tuyển chọn kỹ lưỡng để đáp ứng nhu cầu của các dự án AI từ cơ bản đến nâng cao. Cùng nhau khám phá, tải về và bắt đầu huấn luyện mô hình AI của bạn ngay hôm nay.
1. Bộ ảnh ‘car’ cho bài toán image classification
Thông tin chung
Bộ ảnh aicandy_car_cokgysdg bao gồm 8145 ảnh RGB theo định dạng (*.jpg), các ảnh chứa các xe oto có màu sắc, hãng xe, kích thước, góc nhìn … khác nhau.
Bộ dữ liệu này phù hợp với các dự án: AIcandy_AlexNet_ImageClassification_uddrlyxa, AIcandy_DenseNet_ImageClassification_mexgtkug, AIcandy_Efficientnet_ImageClassification_rlbyvacq, AIcandy_GoogleNet_ImageClassification_issabxru, AIcandy_MobileNet_ImageClassification_gargdlos, AIcandy_ResNet18_ImageClassification_hnxhkhii, AIcandy_ResNet50_ImageClassification_ibuyesha
Download
2. Bộ ảnh ‘dog’ cho bài toán image classification
Thông tin chung
Bộ ảnh aicandy_dogs_lpmdvpox bao gồm 1992 ảnh RGB theo định dạng (*.jpg), các ảnh chứa ‘dog’ có màu sắc, chủng loại, kích thước, góc nhìn … khác nhau.
Bộ dữ liệu này phù hợp với các dự án: AIcandy_AlexNet_ImageClassification_uddrlyxa, AIcandy_DenseNet_ImageClassification_mexgtkug, AIcandy_Efficientnet_ImageClassification_rlbyvacq, AIcandy_GoogleNet_ImageClassification_issabxru, AIcandy_MobileNet_ImageClassification_gargdlos, AIcandy_ResNet18_ImageClassification_hnxhkhii, AIcandy_ResNet50_ImageClassification_ibuyesha
Download
3. Bộ ảnh ‘cat’ cho bài toán image classification
Thông tin chung
Bộ ảnh aicandy_cats_mkemktch bao gồm 1999 ảnh RGB theo định dạng (*.jpg), các ảnh chứa ‘cat’ có màu sắc, chủng loại, kích thước, góc nhìn … khác nhau.
Bộ dữ liệu này phù hợp với các dự án: AIcandy_AlexNet_ImageClassification_uddrlyxa, AIcandy_DenseNet_ImageClassification_mexgtkug, AIcandy_Efficientnet_ImageClassification_rlbyvacq, AIcandy_GoogleNet_ImageClassification_issabxru, AIcandy_MobileNet_ImageClassification_gargdlos, AIcandy_ResNet18_ImageClassification_hnxhkhii, AIcandy_ResNet50_ImageClassification_ibuyesha
Download
4. Bộ ảnh ‘clock’ cho bài toán image classification
Thông tin chung
Bộ ảnh aicandy_clock_idlunsct bao gồm 1292 ảnh RGB theo định dạng (*.jpg), các ảnh chứa ‘clock’ có màu sắc, chủng loại, kích thước, góc nhìn … khác nhau.
Bộ dữ liệu này phù hợp với các dự án: AIcandy_AlexNet_ImageClassification_uddrlyxa, AIcandy_DenseNet_ImageClassification_mexgtkug, AIcandy_Efficientnet_ImageClassification_rlbyvacq, AIcandy_GoogleNet_ImageClassification_issabxru, AIcandy_MobileNet_ImageClassification_gargdlos, AIcandy_ResNet18_ImageClassification_hnxhkhii, AIcandy_ResNet50_ImageClassification_ibuyesha
- Download
5. Bộ ảnh ‘laptop’ cho bài toán image classification
Thông tin chung
Bộ ảnh aicandy_laptop_tciidcvg bao gồm 1300 ảnh RGB theo định dạng (*.jpg), các ảnh chứa ‘clock’ có màu sắc, chủng loại, kích thước, góc nhìn … khác nhau.
Bộ dữ liệu này phù hợp với các dự án: AIcandy_AlexNet_ImageClassification_uddrlyxa, AIcandy_DenseNet_ImageClassification_mexgtkug, AIcandy_Efficientnet_ImageClassification_rlbyvacq, AIcandy_GoogleNet_ImageClassification_issabxru, AIcandy_MobileNet_ImageClassification_gargdlos, AIcandy_ResNet18_ImageClassification_hnxhkhii, AIcandy_ResNet50_ImageClassification_ibuyesha
- Download
6. Bộ ảnh ‘motorcycle’ cho bài toán Object Detection
Thông tin chung
Bộ ảnh aicandy_motorcycle_humukdiy bao gồm 3 folder “train2017”, “val2017” và “annotations” chứa thông tin về ảnh. Folder “train2017” có 3502 ảnh, folder “val2017” có 159 ảnh, tất cả ảnh đều là RGB theo định dạng (*.jpg), các ảnh chứa ‘motorcycle’ có màu sắc, chủng loại, kích thước, góc nhìn … khác nhau. Bộ ảnh này được tách chỉ có đối tượng “motorcyle” từ bộ COCO2017.
Bộ dữ liệu này phù hợp với các dự án: AIcandy_RetinaNet_ObjectDetection_mqeprgnq
- Download
7. Bộ ảnh ‘obj’ cho bài toán Object Detection
Thông tin chung
Bộ ảnh aicandy_obj_nskpbsgv bao gồm 9963 ảnh RGB theo định dạng (*.jpg), thuộc 20 đối tượng khác nhau. Tên của các đối tượng (aeroplane, bicycle, bird, boat, …) được lưu trong file label_map.json. Bộ dữ liệu được chia làm 2 phần “train” và “test”. Thông tin về tên và tọa độ boxes của nhóm ảnh test lưu trong file “test_images.json” và “test_objects.json”. Thông tin về tên và tọa độ boxes của nhóm ảnh train lưu trong file “train_images.json” và “train_objects.json”.
Bộ dữ liệu này phù hợp với các dự án: AIcandy_SSD300_ObjectDetection_urentmnt
- Download
8. Bộ ảnh ‘obj’ cho bài toán YOLO
Thông tin chung
Bộ ảnh aicandy_obj_aegduuyx bao gồm 7198 ảnh RGB theo định dạng (*.jpg), và 7198 file text chứa tọa độ box các đối tượng có trong ảnh. Bộ dữ liệu có 6 đối tượng khác nhau (gồm: xe tải quân sự, xe ô tô dân dụng, xe tăng quân sự, máy bay dân dụng, máy bay quân sự và trực thăng quân sự ). Bộ dữ liệu được chia làm 2 phần “train” và “val”. Tập train gồm 6702 ảnh, tập val gồm 496 ảnh.
Bộ dữ liệu này phù hợp với các dự án: AIcandy_YOLO5_qvlcalbh và AIcandy_YOLO8_pecdlttq
- Download
9. Bộ dữ liệu training LLM 1
Thông tin chung
Tệp dữ liệu aicandy_llm_dataset_msbagtmv bao gồm các bộ {“question”: “…”, “answer”: “…”} về chủ đề trí tuệ nhân tạo và học máy phục vụ fine-tuning Large Language Model – LLM model.
Bộ dữ liệu này phù hợp với dự án: AIcandy_LLM_Finetuning_bloom_560m_iehimqko
- Download
10. Bộ dữ liệu training LLM 2
Thông tin chung
Tệp dữ liệu aicandy_llm_dataset_qmvqmhro.txt bao gồm nhiều câu nói hay về cuộc sống phục vụ training Large Language Model – LLM model.
Bộ dữ liệu này phù hợp với dự án: AIcandy_LLM_MicroLLM_ihdvcmqe
- Download
- Download
- Download
- Download