Ctrl K

Llama 3 Groq 8B Tool Use (Preview)

llama3-groq-8b-8192-tool-use-preview

Llama 3 Groq 8B Tool Use là mô hình được tối ưu hóa cho việc sử dụng công cụ hiệu quả, hỗ trợ tính toán song song nhanh chóng.

Nhà cung cấp hỗ trợ mô hình này

llama3-groq-8b-8192-tool-use-preview

Độ dài ngữ cảnh tối đa

Độ dài đầu ra tối đa

Giá đầu vào

$0.19

Giá đầu ra

$0.19

llama3-groq-8b-8192-tool-use-preview

Độ dài ngữ cảnh tối đa

Độ dài đầu ra tối đa

Giá đầu vào

$0.19

Giá đầu ra

$0.19

Tham số mô hình

Ngẫu nhiên

temperature

Cài đặt này ảnh hưởng đến sự đa dạng trong phản hồi của mô hình. Giá trị thấp hơn dẫn đến phản hồi dễ đoán và điển hình hơn, trong khi giá trị cao hơn khuyến khích phản hồi đa dạng và không thường gặp. Khi giá trị được đặt là 0, mô hình sẽ luôn đưa ra cùng một phản hồi cho đầu vào nhất định. Xem tài liệu

Loại

FLOAT

Giá trị mặc định

1.00

Phạm vi

0.00 ~ 2.00

Lấy mẫu hạt nhân

top_p

Cài đặt này giới hạn lựa chọn của mô hình chỉ trong một tỷ lệ từ có khả năng cao nhất: chỉ chọn những từ hàng đầu có xác suất tích lũy đạt P. Giá trị thấp hơn làm cho phản hồi của mô hình dễ đoán hơn, trong khi cài đặt mặc định cho phép mô hình chọn từ toàn bộ phạm vi từ vựng. Xem tài liệu

Loại

FLOAT

Giá trị mặc định

1.00

Phạm vi

0.00 ~ 1.00

Độ mới của chủ đề

presence_penalty

Cài đặt này nhằm kiểm soát việc lặp lại từ vựng dựa trên tần suất xuất hiện của từ trong đầu vào. Nó cố gắng sử dụng ít hơn những từ đã xuất hiện nhiều trong đầu vào, với tần suất sử dụng tỷ lệ thuận với tần suất xuất hiện. Hình phạt từ vựng tăng theo số lần xuất hiện. Giá trị âm sẽ khuyến khích việc lặp lại từ vựng. Xem tài liệu

Loại

FLOAT

Giá trị mặc định

0.00

Phạm vi

-2.00 ~ 2.00

Hình phạt tần suất

frequency_penalty

Cài đặt này điều chỉnh tần suất mà mô hình lặp lại các từ cụ thể đã xuất hiện trong đầu vào. Giá trị cao hơn làm giảm khả năng lặp lại này, trong khi giá trị âm tạo ra hiệu ứng ngược lại. Hình phạt từ vựng không tăng theo số lần xuất hiện. Giá trị âm sẽ khuyến khích việc lặp lại từ vựng. Xem tài liệu

Loại

FLOAT

Giá trị mặc định

0.00

Phạm vi

-2.00 ~ 2.00

Giới hạn phản hồi một lần

max_tokens

Cài đặt này xác định độ dài tối đa mà mô hình có thể tạo ra trong một lần phản hồi. Việc đặt giá trị cao hơn cho phép mô hình tạo ra những phản hồi dài hơn, trong khi giá trị thấp hơn sẽ giới hạn độ dài của phản hồi, giúp nó ngắn gọn hơn. Tùy thuộc vào các tình huống ứng dụng khác nhau, điều chỉnh giá trị này một cách hợp lý có thể giúp đạt được độ dài và mức độ chi tiết mong muốn của phản hồi. Xem tài liệu

Loại

INT

Giá trị mặc định

Mức độ suy luận

reasoning_effort

Cài đặt này được sử dụng để kiểm soát mức độ suy luận của mô hình trước khi tạo câu trả lời. Mức độ thấp ưu tiên tốc độ phản hồi và tiết kiệm Token, trong khi mức độ cao cung cấp suy luận đầy đủ hơn nhưng tiêu tốn nhiều Token hơn và làm giảm tốc độ phản hồi. Giá trị mặc định là trung bình, cân bằng giữa độ chính xác của suy luận và tốc độ phản hồi. Xem tài liệu

Loại

STRING

Giá trị mặc định

Phạm vi

low ~ high

Mô hình liên quan

Llama 3 Groq 8B Tool Use (Preview)

Nhà cung cấp hỗ trợ mô hình này

Tham số mô hình

Mô hình liên quan

Llama 3.3 70B

Llama 3.2 11B Vision (Preview)

Llama 3.2 90B Vision (Preview)

Llama 3.1 8B

Llama 3.1 70B