“Darkbert AI được đào tạo trên web tối, có thể chống lại tội phạm mạng”

DarkBERT là một công cụ hỗ trợ cho các chuyên gia an ninh mạng trong việc thu thập thông tin tình báo về mối đe dọa mạng. Được phát triển bởi một nhóm các học giả Hàn Quốc, DarkBERT là một mô hình bộ mã hóa dựa trên kiến trúc RoBERTa, được đào tạo trên hàng triệu trang web tối, bao gồm dữ liệu từ các diễn đàn tin tặc, trang web lừa đảo và các nguồn internet tội phạm khác. DarkBERT có khả năng khám phá các cụm từ liên quan đến hành động bất hợp pháp và giúp xác định và giải quyết các rủi ro mạng mới. Đây là một công cụ quan trọng để nghiên cứu thêm về web tối và sử dụng trong các hoạt động an ninh mạng khác nhau. Tuy nhiên, DarkBERT đang trong quá trình hoàn thiện và hiệu suất của nó có thể được cải thiện bằng cách liên tục đào tạo và tinh chỉnh.
AI nhằm mục đích hỗ trợ các chuyên gia an ninh mạng thu thập thông tin tình báo về mối đe dọa mạng
Trong một động thái chưa từng có, một nhóm các học giả Hàn Quốc đã tạo ra DarkBERT, một người LLM chỉ được đào tạo về web tối thông tin. Họ nhằm mục đích phát triển một trí tuệ nhân tạo công cụ vượt qua các mô hình ngôn ngữ hiện có và giúp các nhà nghiên cứu mối đe dọa, cơ quan thực thi pháp luật và an ninh mạng các chuyên gia trong việc chống lại các mối đe dọa mạng.
DarkKBERT là gì?
DarkBERT là mô hình bộ mã hóa dựa trên máy biến áp dựa trên kiến trúc RoBERTa. LLM đã được đào tạo trên hàng triệu trang web tối, bao gồm dữ liệu từ các diễn đàn tin tặc, trang web lừa đảo và các nguồn internet tội phạm khác. Thuật ngữ dark web dùng để chỉ các khu vực ẩn của Internet mà trình duyệt web tiêu chuẩn không thể truy cập được. Lĩnh vực này được biết đến với các trang web và thị trường ẩn danh, nổi tiếng với các hoạt động tội phạm như buôn bán dữ liệu bị đánh cắp, ma tuý và vũ khí.
Các nhà nghiên cứu đã sử dụng mạng Tor để có quyền truy cập vào dark web và thu thập dữ liệu thô để huấn luyện DarkBERT. Họ cẩn thận lọc dữ liệu này bằng các kỹ thuật như chống trùng lặp, cân bằng danh mục và tiền xử lý để tạo ra cơ sở dữ liệu dark web tinh chỉnh. Sau đó, nó được cung cấp cho Roberta trong khoảng 15 ngày để tạo ra DarkBERT.
Công dụng tiềm năng của DarkBERT trong An ninh mạng: DarkBERT có hiểu biết đáng kinh ngạc về ngôn ngữ chung của tội phạm mạng và xuất sắc trong việc xác định các mối nguy hiểm cụ thể. Nó có thể tiến hành nghiên cứu dark web, đồng thời khám phá thành công và nêu bật các nguy cơ an ninh mạng như vi phạm dữ liệu và mã độc tống tiền, khiến nó trở thành vũ khí tiềm năng có giá trị trong cuộc chiến chống lại các mối đe dọa mạng.
Các nhà nghiên cứu đã so sánh DarkBERT với hai mô hình NLP nổi tiếng là BERT và RoBERTa, phân tích hiệu suất của chúng trong ba trường hợp sử dụng quan trọng liên quan đến an ninh mạng, theo nghiên cứu được công bố trên arxiv.org.
- Kiểm tra Diễn đàn web tối để biết các chủ đề có khả năng gây hại: Theo dõi các diễn đàn dark web, được sử dụng rộng rãi để trao đổi thông tin bất hợp pháp, rất quan trọng để phát hiện các bài đăng có khả năng gây hại. Tuy nhiên, việc kiểm tra chúng theo cách thủ công có thể tốn thời gian, vì vậy, các chuyên gia bảo mật sẽ được hưởng lợi từ việc tự động hóa quy trình.
- Tìm các trang web lưu trữ thông tin nhạy cảm: Các nhóm tin tặc và ransomware sử dụng dark web để thiết lập các trang web rò rỉ nhằm tiết lộ thông tin mật bị đánh cắp từ các công ty từ chối trả tiền chuộc. Một số kẻ lừa đảo chỉ đăng tài liệu nhạy cảm bị rò rỉ lên web tối, chẳng hạn như mật khẩu và thông tin ngân hàng, với ý định bán nó.
- Tác động của các từ khóa liên quan đến mối đe dọa trên Dark Web: DarkBERT sử dụng chức năng lấp đầy mặt nạ, một tính năng của họ mô hình ngôn ngữ BERT, để phát hiện một cách đáng tin cậy các cụm từ liên quan đến hoạt động tội phạm, chẳng hạn như giao dịch ma túy trên web tối. DarkBERT tạo các từ liên quan đến ma túy khi “MDMA” bị ẩn trên các trang web bán ma túy, nhưng các mô hình khác đề xuất các từ chung chung và từ khóa không liên quan đến ma túy, chẳng hạn như nhiều ngành nghề. Khả năng khám phá các cụm từ liên quan đến hành động bất hợp pháp của DarkBERT có thể giúp xác định và giải quyết các rủi ro mạng mới.
Sử dụng AI để phát hiện và ngăn chặn mối đe dọa: DarkBERT đã được đào tạo trước về dữ liệu web tối và vượt trội so với các mô hình ngôn ngữ hiện có trong nhiều trường hợp sử dụng an ninh mạng, khiến DarkBERT trở thành một công cụ quan trọng để nghiên cứu thêm về web tối. AI tối được đào tạo trên web có thể được sử dụng cho các hoạt động an ninh mạng khác nhau, chẳng hạn như xác định các trang web bán dữ liệu cá nhân bị rò rỉ, giám sát các diễn đàn web tối để trao đổi thông tin bất hợp pháp và tìm kiếm các từ khóa liên quan đến các mối nguy hiểm trên mạng. Tuy nhiên, hãy nhớ rằng DarkBERT, giống như các LLM khác, là một sản phẩm đang trong quá trình hoàn thiện và hiệu suất của nó có thể được cải thiện bằng cách liên tục đào tạo và tinh chỉnh.