Một thế hệ chatbot mới tạo ra các văn bản mạch lạc, có ý nghĩa. Điều này có thể giúp ích cho cả tội phạm mạng và những người bảo vệ mạng.

Mặc dù các nguyên tắc của học máy đã được đặt ra cách đây nửa thế kỷ, nhưng chỉ gần đây chúng mới được ứng dụng rộng rãi trong thực tế. Khi sức mạnh điện toán tăng lên, trước tiên, máy tính học cách phân biệt các đối tượng trong hình ảnh và chơi cờ vây tốt hơn con người, sau đó vẽ tranh dựa trên mô tả văn bản và duy trì một cuộc trò chuyện mạch lạc. Vào năm 2021–2022, tất cả mọi người đều có thể tiếp cận được các đột phá khoa học. Ví dụ: bạn có thể đăng ký MidJourney và, giả sử, ngay lập tức minh họa sách của riêng bạn. Và OpenAI cuối cùng đã mở rộng mô hình ngôn ngữ GPT-3 (Generative Pretraining Transformer 3) cho công chúng thông qua ChatGPT. Bot có sẵn tại chat.openai.com, nơi bạn có thể tự mình xem cách nó duy trì cuộc trò chuyện mạch lạc, giải thích các khái niệm khoa học phức tạp tốt hơn nhiều giáo viên, dịch văn bản giữa các ngôn ngữ một cách nghệ thuật, v.v.
Nếu chúng tôi loại bỏ ChatGPT xuống các yếu tố cơ bản nhất, thì mô hình ngôn ngữ được đào tạo trên một kho văn bản trực tuyến khổng lồ, từ đó nó “ghi nhớ” những từ, câu và đoạn văn nào được sắp xếp theo thứ tự thường xuyên nhất và cách chúng liên kết với nhau. Được hỗ trợ bởi nhiều thủ thuật kỹ thuật và các vòng đào tạo bổ sung với con người, mô hình này được tối ưu hóa đặc biệt cho hộp thoại. Bởi vì “trên internet, bạn có thể tìm thấy tất cả mọi thứ”, mô hình này đương nhiên có thể hỗ trợ đối thoại về hầu hết các chủ đề: từ thời trang và lịch sử nghệ thuật đến lập trình và vật lý lượng tử.
Các nhà khoa học, nhà báo và những người đam mê thuần túy đang tìm kiếm nhiều ứng dụng hơn cho ChatGPT. Trang web lời nhắc ChatGPT tuyệt vời có một danh sách lời nhắc (cụm từ để bắt đầu cuộc trò chuyện với bot), cho phép “chuyển đổi” ChatGPT để nó phản hồi theo phong cách của Gandalf hoặc một số nhân vật văn học khác, viết mã Python, tạo doanh nghiệp thư và sơ yếu lý lịch, và thậm chí bắt chước một thiết bị đầu cuối Linux. Tuy nhiên, ChatGPT vẫn chỉ là một mô hình ngôn ngữ, vì vậy tất cả những điều trên không gì khác hơn là các tổ hợp và cụm từ phổ biến — bạn sẽ không tìm thấy bất kỳ lý do hay logic nào trong đó. Đôi khi, ChatGPT nói những điều vô nghĩa thuyết phục (giống như nhiều người), chẳng hạn như bằng cách đề cập đến các nghiên cứu khoa học không tồn tại. Vì vậy, hãy luôn thận trọng khi xử lý nội dung ChatGPT. Điều đó nói rằng, ngay cả ở dạng hiện tại, bot vẫn hữu ích trong nhiều quy trình và ngành thực tế. Dưới đây là một số ví dụ trong lĩnh vực an ninh mạng.
Tạo ra mã độc
Trên các diễn đàn tin tặc ngầm, tội phạm mạng mới làm quen báo cáo cách họ sử dụng ChatGPT để tạo Trojan mới. Bot có thể viết mã, vì vậy nếu bạn mô tả ngắn gọn chức năng mong muốn (“lưu tất cả mật khẩu trong tệp X và gửi qua HTTP POST tới máy chủ Y”), bạn có thể nhận được một trình đánh cắp thông tin đơn giản mà không cần có bất kỳ kỹ năng lập trình nào. Tuy nhiên, người dùng ngay thẳng không có gì phải sợ. Nếu mã do bot viết thực sự được sử dụng, các giải pháp bảo mật sẽ phát hiện và vô hiệu hóa nó nhanh chóng và hiệu quả như tất cả các phần mềm độc hại trước đây do con người tạo ra. Hơn nữa, nếu mã như vậy không được kiểm tra bởi một lập trình viên có kinh nghiệm, thì phần mềm độc hại có khả năng chứa các lỗi tinh vi và lỗi logic khiến nó kém hiệu quả hơn.
Ít nhất là hiện tại, các bot chỉ có thể cạnh tranh với những người viết virus mới làm quen.
Phân tích mã độc
Khi các nhà phân tích của InfoSec nghiên cứu các ứng dụng đáng ngờ mới, họ dịch ngược, mã giả hoặc mã máy, cố gắng tìm ra cách thức hoạt động của nó. Mặc dù nhiệm vụ này không thể được giao hoàn toàn cho ChatGPT, nhưng chatbot đã có khả năng giải thích nhanh chóng chức năng của một đoạn mã cụ thể. Đồng nghiệp của chúng tôi, Ivan Kwiatkovski, đã phát triển một plugin cho IDA Pro thực hiện chính xác điều đó. Mô hình ngôn ngữ dưới mui xe không thực sự là ChatGPT – mà là người anh em họ của nó, davinci-003 – nhưng đây hoàn toàn là một sự khác biệt về mặt kỹ thuật. Đôi khi plugin không hoạt động hoặc xuất ra rác, nhưng đối với những trường hợp khi nó tự động gán tên hợp pháp cho các hàm và xác định thuật toán mã hóa trong mã cũng như các tham số của chúng, thì nó đáng để bạn có trong túi đồ nghề của mình. Nó tự phát huy tác dụng trong điều kiện SOC, nơi các nhà phân tích thường xuyên bị quá tải phải dành một lượng thời gian tối thiểu cho mỗi sự cố, vì vậy, bất kỳ công cụ nào để tăng tốc quá trình đều được hoan nghênh.

Nghiên cứu lỗ hổng bảo mật
Một biến thể của phương pháp trên là tự động tìm kiếm mã dễ bị tấn công. Chatbot “đọc” mã giả của một ứng dụng dịch ngược và xác định những nơi có thể chứa lỗ hổng. Hơn nữa, bot cung cấp mã Python được thiết kế để khai thác lỗ hổng (PoC). Chắc chắn, bot có thể mắc đủ loại lỗi, trong cả việc tìm kiếm lỗ hổng bảo mật và viết mã PoC, nhưng ngay cả ở dạng hiện tại, công cụ này vẫn được sử dụng cho cả kẻ tấn công và người bảo vệ.
Tư vấn bảo mật
Vì ChatGPT biết mọi người đang nói gì về an ninh mạng trực tuyến nên lời khuyên của họ về chủ đề này có vẻ thuyết phục. Tuy nhiên, như với bất kỳ lời khuyên nào của chatbot, bạn không bao giờ biết chính xác nó đến từ đâu, vì vậy cứ 10 mẹo hay thì có thể có một mẹo ngớ ngẩn. Tất cả đều giống nhau, ví dụ như các mẹo trong ảnh chụp màn hình bên dưới đều hợp lý:

Tấn công phishing và kiểm soát Email doanh nghiệp
Văn bản thuyết phục là một điểm mạnh của GPT-3 và ChatGPT, vì vậy các cuộc tấn công lừa đảo tự động bằng chatbot có thể đã xảy ra. Vấn đề chính với các e-mail lừa đảo hàng loạt là chúng trông không ổn, với quá nhiều văn bản chung chung không nói trực tiếp với người nhận. Đối với lừa đảo qua mạng, khi một tội phạm mạng trực tiếp viết e-mail cho một nạn nhân, nó khá tốn kém; do đó, nó chỉ được sử dụng trong các cuộc tấn công có chủ đích. ChatGPT được thiết lập để thay đổi đáng kể sự cân bằng quyền lực, bởi vì nó cho phép những kẻ tấn công tạo ra các e-mail có sức thuyết phục và được cá nhân hóa ở quy mô công nghiệp. Tuy nhiên, để một e-mail có đầy đủ các thành phần cần thiết, chatbot phải được hướng dẫn rất chi tiết.

Nhưng các cuộc tấn công lừa đảo lớn thường bao gồm một loạt e-mail, mỗi e-mail dần dần chiếm được lòng tin của nạn nhân. Vì vậy, đối với các email thứ hai, thứ ba và thứ n, ChatGPT sẽ thực sự tiết kiệm rất nhiều thời gian cho tội phạm mạng. Vì chatbot ghi nhớ ngữ cảnh của cuộc trò chuyện nên các e-mail tiếp theo có thể được tạo đẹp mắt từ một lời nhắc rất ngắn và đơn giản.

Hơn nữa, phản ứng của nạn nhân có thể dễ dàng được đưa vào mô hình, tạo ra kết quả theo dõi thuyết phục chỉ trong vài giây.
Trong số các công cụ mà kẻ tấn công có thể sử dụng là thư từ cách điệu. Chỉ cần cung cấp một mẫu nhỏ của một phong cách cụ thể, hộp trò chuyện có thể dễ dàng áp dụng nó trong các tin nhắn tiếp theo. Điều này cho phép tạo ra các e-mail giả có vẻ thuyết phục từ nhân viên này sang nhân viên khác.
Thật không may, điều này có nghĩa là số lượng các cuộc tấn công lừa đảo thành công sẽ chỉ tăng lên. Và chatbot sẽ có sức thuyết phục không kém trong e-mail, mạng xã hội và trình nhắn tin.
Làm thế nào để chống lại? Các chuyên gia phân tích nội dung đang tích cực phát triển các công cụ phát hiện văn bản chatbot. Thời gian sẽ cho biết mức độ hiệu quả của các bộ lọc này. Nhưng hiện tại, chúng tôi chỉ có thể đề xuất hai mẹo tiêu chuẩn (đào tạo nâng cao nhận thức về cảnh giác và an ninh mạng), cộng với một mẹo mới. Tìm hiểu cách phát hiện văn bản do bot tạo. Các thuộc tính toán học không thể nhận ra bằng mắt thường, nhưng những điều kỳ quặc nhỏ về phong cách và những điểm không phù hợp nhỏ vẫn khiến rô bốt bỏ qua. Hãy xem trò chơi này để xem liệu bạn có thể phát hiện ra sự khác biệt giữa văn bản do con người viết và máy viết hay không.
Hãy liên hệ ngay Kaspersky Việt Nam để nhận được hỗ trợ, tư vấn về an ninh mạng. SĐT HOTLINE 0929.247.123