Giải pháp tự động tổng hợp tin tức VnExpress với AI bằng n8n

Bạn muốn tự động tổng hợp nội dung từ VnExpress một cách nhanh chóng và hiệu quả? Trong bài viết này, chúng tôi sẽ hướng dẫn chi tiết cách sử dụng n8n có sử dụng model AI để xây dựng quy trình tự động hóa, thu thập và quản lý tin tức từ VnExpress sau đó gửi thông tin đã tổng hợp tới email, giúp bạn tiết kiệm thời gian và tối ưu hóa việc khai thác thông tin chất lượng cao.

1. Giới thiệu

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_1

Giới thiệu về VnExpress

VnExpress là một trong những tờ báo điện tử hàng đầu tại Việt Nam, cung cấp tin tức nhanh chóng, chính xác và đa dạng về các lĩnh vực như kinh tế, chính trị, xã hội, văn hóa và công nghệ. Với hàng triệu lượt truy cập mỗi ngày, VnExpress đã trở thành nguồn thông tin đáng tin cậy, đáp ứng nhu cầu cập nhật tin tức của độc giả trong và ngoài nước.

Giới thiệu về n8n

n8n là một công cụ mã nguồn mở mạnh mẽ, được thiết kế để tự động hóa quy trình công việc, cho phép người dùng dễ dàng tạo và quản lý các luồng công việc phức tạp mà không cần viết nhiều mã. Sở hữu giao diện kéo-thả thân thiện, n8n hỗ trợ tích hợp với hàng trăm ứng dụng như Google Sheets, Slack, Trello và API tùy chỉnh, giúp tự động hóa các tác vụ lặp lại. Điểm đặc biệt của n8n nằm ở khả năng tự lưu trữ, đảm bảo người dùng toàn quyền kiểm soát dữ liệu và tăng cường bảo mật.

2. Lợi ích của việc tự động tổng hợp nội dung VnExpress bằng n8n

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_2_node

Việc sử dụng n8n để tự động tổng hợp nội dung từ VnExpress mang lại hiệu quả vượt trội về thời gian và công sức. Thay vì phải truy cập thủ công, tìm kiếm và sao chép bài viết, n8n cho phép thiết lập quy trình tự động thu thập tin tức theo các tiêu chí như danh mục, từ khóa hoặc thời gian. Người dùng có thể tích hợp dữ liệu vào các nền tảng như Google Sheets, WordPress hoặc email để lưu trữ và sử dụng dễ dàng. Hơn nữa, n8n hỗ trợ tùy chỉnh linh hoạt, phù hợp với nhu cầu cá nhân hoặc doanh nghiệp, từ việc tổng hợp tin tức để phân tích thị trường đến tạo nội dung cho các kênh truyền thông.

Tự động hóa với n8n giúp nâng cao hiệu quả quản lý thông tin và tối ưu hóa chiến lược nội dung. Bằng cách sử dụng các workflow của n8n, người dùng có thể lập lịch thu thập bài viết từ VnExpress, lọc nội dung theo chủ đề cụ thể và tự động dịch, tóm tắt hoặc phân loại thông tin. Điều này đặc biệt hữu ích cho các nhà tiếp thị, nhà báo hoặc doanh nghiệp cần cập nhật tin tức nhanh chóng để đưa ra quyết định kịp thời. Với giao diện thân thiện và khả năng không yêu cầu kỹ năng lập trình phức tạp, n8n phù hợp cho cả người mới bắt đầu lẫn chuyên gia, mang lại giải pháp tiết kiệm chi phí và tăng cường hiệu suất trong việc khai thác nguồn tin từ VnExpress.

3. Hướng dẫn chi tiết từng node

Tạo lịch hoạt động của workflow

Setup cho workflow tự động chạy theo lịch để phù hợp với nhu cầu của mỗi người bằng node “Schedule Trigger”, trong giai đoạn demo/thử nghiệm mình sử dụng thêm node “Manual Trigger”.

Node HTTP Request 1

Trong VnExpress, chúng ta có thể lấy thông tin về tin tức thế giới mới nhất tại: https://vnexpress.net/rss/the-gioi.rss 

Sử dụng node “HTTP request 1” để lấy thông tin thô từ URL. Trong node này, sử dụng phương thức “GET ” để nhận dữ liệu trả về từ website. Thông số cấu hình và dữ liệu trả về như ảnh dưới.

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_3_node

Node XML

Đầu ra của node “HTML Request 1” ở dạng xml, do đó sử dụng node “XML” để chuyển dữ liệu xml này về dạng JSON cho dễ quản lý và sử dụng hơn. Tại khung “Property Name” điền chuỗi đại diện cho dữ liệu cần chuẩn đổi, ở đây là “data”. Đầu vào và đầu ra ở node XML này như ảnh dưới.

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_4

Node Split Out

Đầu ra của node XML ở dạng JSON và có nhiều trường thông tin như version, channel, item, description, image, url, link, pubDate … Mục đích của chúng ta là nội dung của bài viết, không cần các thông tin bổ trợ. Do đó sử dụng node “Split Out” để tập trung vào lấy những bài viết cần thiết. Các bài viết được chứa trong rss.channel.item vì vậy đây là key word để lọc. Tham số và đầu vào, đầu ra của node này như ảnh dưới:

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_5

Node Limit

Đâu ra của Split Out bao gồm rất nhiều bài viết, do đó chúng ta có thể sử dụng thêm node Litmit để giới hạn số bài viết tối đa muốn tổng hợp. Số 6 là số đẹp nên trong bài viết này mình sẽ lấy tối đa 6 bài viết mới nhất.

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_6

Node HTTP Rquest 2

Sau khi đã có được thông tin địa chỉ các bài viết mới nhất, ta cần sử dụng node http request để tải nội dung của từng bài viết. Địa chỉ URL của từng bài viết tại trường link trong json ở node trước đó. Do đó, cấu hình tham số và đầu vào, đầu ra của node như ảnh dưới:

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_7

Node HTML extractHtmlContent

Sau node HTTP request 2 dữ liệu website trả về là tệp html bao gồm nội dung của bài viết nằm trong các thẻ html, nội dung phần CSS, javascript …. nên chúng ta cần một node làm nhiệm vụ tách lấy nội dung của bài viết. Và node HTML extractHtmlContent được sử dụng để làm việc này. 

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_8

Node Code 1

Đầu ra của node HTML extractHtmlContent gồm nhiều đoạn nội dung, trong đoạn có thể có các ký tự xuống dòng “\n”, do đó ta cần thêm node để chuẩn hóa và ghép các đoạn riêng này thành 1 bài viết hoàn chỉnh. Để làm việc này, sử dụng node Code và chạy đoạn lệnh script để chuẩn hóa và ghép nội dung như ảnh dưới:

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_9

Node AI Agent

Đầu ra của Code 1 là nội dung hoàn chỉnh của bài viết trên VnExpress, chúng ta cần đưa bài viết vào mô hình AI để hiểu và tóm tắt lại ý chính hoặc viết lại theo văn phong cũng như mục đích của mình. Trong bài viết này, mình sẽ yêu cầu AI Agent sử dụng tối đa 10 câu để tóm tắt ngắn gọn lại bài viết. Mô hình AI được sử dụng là Google Gemini Chat (bản mới nhất là 2.0).

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_12_AI_Agent

Node Code 2

Ở bước trên, do có 6 bài viết đã được tóm tắt, ta cần tổng hợp lại thành 1 bài viết trước khi gửi email. Sử dụng node Code 2 để thêm các đề mục mong muốn.

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_11

Node Gmail

Và node cuối cùng là gửi thông tin đã tổng hợp tới địa chỉ email mong muốn. Ví dụ, mình tổng hợp và gửi thông tin hoàn chỉnh tới email: [email protected] như ảnh dưới. Nếu bạn chưa kết nối tài khoản google với n8n thì xem bài viết này để kết nối Hướng dẫn kết nối Google account với n8n: Tự động hóa quy trình

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_gmail

4. Kết quả

Sau khi cấu hình hoàn chỉnh, nhấn “Test workflow” và kiểm tra email. Email đã nhận được bài tổng hợp thông tin đúng như mong muốn, phía dưới có dòng chữ “This email was sent automatically with n8n
https://n8n.io” để báo hiệu rằng email được gửi từ n8n.

aicandy_giai_phap_tu_dong_tong_hop_noi_dung_vnexpress_bang_n8n_ket_qua_gmail

5. Kết luận

Tự động tổng hợp nội dung VnExpress bằng n8n là giải pháp tối ưu giúp tiết kiệm thời gian và nâng cao hiệu quả quản lý thông tin. Qua bài viết, bạn đã được hướng dẫn chi tiết cách thiết lập từng node trong workflow, từ thu thập dữ liệu, lọc bài viết, đến gửi bản tin tóm tắt qua email. Kết quả là một quy trình tự động mượt mà, đảm bảo bạn luôn nhận được thông tin mới nhất từ VnExpress mà không cần thao tác thủ công. Giải pháp này đặc biệt hữu ích cho các nhà tiếp thị, nhà báo hoặc doanh nghiệp cần theo dõi tin tức nhanh chóng.

Với tính linh hoạt của n8n, bạn có thể tùy chỉnh workflow để đáp ứng nhu cầu cụ thể, như phân tích dữ liệu hoặc tích hợp với các nền tảng khác. Hãy tận dụng n8n để khai thác tối đa tiềm năng của tự động hóa trong việc quản lý nội dung!

6. Tải workflow

Workflow tổng hợp nội dung VnExpress bằng n8n được chia sẻ miễn phí tại kho dữ liệu dành cho học máy 

Xem thêm bài viết cùng chủ đề: