Ctrl K

Llama 3.1 8B

llama3.1

Llama 3.1 là mô hình tiên tiến do Meta phát hành, hỗ trợ lên đến 405B tham số, có thể áp dụng cho các cuộc đối thoại phức tạp, dịch đa ngôn ngữ và phân tích dữ liệu.

128K

Nhà cung cấp hỗ trợ mô hình này

llama3.1

Độ dài ngữ cảnh tối đa

128K

Độ dài đầu ra tối đa

Giá đầu vào

Giá đầu ra

Tham số mô hình

Ngẫu nhiên

temperature

Cài đặt này ảnh hưởng đến sự đa dạng trong phản hồi của mô hình. Giá trị thấp hơn dẫn đến phản hồi dễ đoán và điển hình hơn, trong khi giá trị cao hơn khuyến khích phản hồi đa dạng và không thường gặp. Khi giá trị được đặt là 0, mô hình sẽ luôn đưa ra cùng một phản hồi cho đầu vào nhất định. Xem tài liệu

Loại

FLOAT

Giá trị mặc định

1.00

Phạm vi

0.00 ~ 2.00

Lấy mẫu hạt nhân

top_p

Cài đặt này giới hạn lựa chọn của mô hình chỉ trong một tỷ lệ từ có khả năng cao nhất: chỉ chọn những từ hàng đầu có xác suất tích lũy đạt P. Giá trị thấp hơn làm cho phản hồi của mô hình dễ đoán hơn, trong khi cài đặt mặc định cho phép mô hình chọn từ toàn bộ phạm vi từ vựng. Xem tài liệu

Loại

FLOAT

Giá trị mặc định

1.00

Phạm vi

0.00 ~ 1.00

Độ mới của chủ đề

presence_penalty

Cài đặt này nhằm kiểm soát việc lặp lại từ vựng dựa trên tần suất xuất hiện của từ trong đầu vào. Nó cố gắng sử dụng ít hơn những từ đã xuất hiện nhiều trong đầu vào, với tần suất sử dụng tỷ lệ thuận với tần suất xuất hiện. Hình phạt từ vựng tăng theo số lần xuất hiện. Giá trị âm sẽ khuyến khích việc lặp lại từ vựng. Xem tài liệu

Loại

FLOAT

Giá trị mặc định

0.00

Phạm vi

-2.00 ~ 2.00

Hình phạt tần suất

frequency_penalty

Cài đặt này điều chỉnh tần suất mà mô hình lặp lại các từ cụ thể đã xuất hiện trong đầu vào. Giá trị cao hơn làm giảm khả năng lặp lại này, trong khi giá trị âm tạo ra hiệu ứng ngược lại. Hình phạt từ vựng không tăng theo số lần xuất hiện. Giá trị âm sẽ khuyến khích việc lặp lại từ vựng. Xem tài liệu

Loại

FLOAT

Giá trị mặc định

0.00

Phạm vi

-2.00 ~ 2.00

Giới hạn phản hồi một lần

max_tokens

Cài đặt này xác định độ dài tối đa mà mô hình có thể tạo ra trong một lần phản hồi. Việc đặt giá trị cao hơn cho phép mô hình tạo ra những phản hồi dài hơn, trong khi giá trị thấp hơn sẽ giới hạn độ dài của phản hồi, giúp nó ngắn gọn hơn. Tùy thuộc vào các tình huống ứng dụng khác nhau, điều chỉnh giá trị này một cách hợp lý có thể giúp đạt được độ dài và mức độ chi tiết mong muốn của phản hồi. Xem tài liệu

Loại

INT

Giá trị mặc định

Mức độ suy luận

reasoning_effort

Cài đặt này được sử dụng để kiểm soát mức độ suy luận của mô hình trước khi tạo câu trả lời. Mức độ thấp ưu tiên tốc độ phản hồi và tiết kiệm Token, trong khi mức độ cao cung cấp suy luận đầy đủ hơn nhưng tiêu tốn nhiều Token hơn và làm giảm tốc độ phản hồi. Giá trị mặc định là trung bình, cân bằng giữa độ chính xác của suy luận và tốc độ phản hồi. Xem tài liệu

Loại

STRING

Giá trị mặc định

Phạm vi

low ~ high

Mô hình liên quan

Llama 3.1 8B

Nhà cung cấp hỗ trợ mô hình này

Tham số mô hình

Mô hình liên quan

Llama 3.1 70B

Llama 3.1 405B

Code Llama 7B

Code Llama 13B

Code Llama 34B