AI Hub
Quay lại khám phá
Meta

Llama 3 Groq 8B Tool Use (Preview)

llama3-groq-8b-8192-tool-use-preview
Llama 3 Groq 8B Tool Use là mô hình được tối ưu hóa cho việc sử dụng công cụ hiệu quả, hỗ trợ tính toán song song nhanh chóng.
8K

Nhà cung cấp hỗ trợ mô hình này

Meta
Groq
Groq
Metallama3-groq-8b-8192-tool-use-preview
Độ dài ngữ cảnh tối đa
8K
Độ dài đầu ra tối đa
--
Giá đầu vào
$0.19
Giá đầu ra
$0.19
Higress
Metallama3-groq-8b-8192-tool-use-preview
Độ dài ngữ cảnh tối đa
8K
Độ dài đầu ra tối đa
--
Giá đầu vào
$0.19
Giá đầu ra
$0.19

Tham số mô hình

Ngẫu nhiên
temperature

Cài đặt này ảnh hưởng đến sự đa dạng trong phản hồi của mô hình. Giá trị thấp hơn dẫn đến phản hồi dễ đoán và điển hình hơn, trong khi giá trị cao hơn khuyến khích phản hồi đa dạng và không thường gặp. Khi giá trị được đặt là 0, mô hình sẽ luôn đưa ra cùng một phản hồi cho đầu vào nhất định. Xem tài liệu

Loại
FLOAT
Giá trị mặc định
1.00
Phạm vi
0.00 ~ 2.00
Lấy mẫu hạt nhân
top_p

Cài đặt này giới hạn lựa chọn của mô hình chỉ trong một tỷ lệ từ có khả năng cao nhất: chỉ chọn những từ hàng đầu có xác suất tích lũy đạt P. Giá trị thấp hơn làm cho phản hồi của mô hình dễ đoán hơn, trong khi cài đặt mặc định cho phép mô hình chọn từ toàn bộ phạm vi từ vựng. Xem tài liệu

Loại
FLOAT
Giá trị mặc định
1.00
Phạm vi
0.00 ~ 1.00
Độ mới của chủ đề
presence_penalty

Cài đặt này nhằm kiểm soát việc lặp lại từ vựng dựa trên tần suất xuất hiện của từ trong đầu vào. Nó cố gắng sử dụng ít hơn những từ đã xuất hiện nhiều trong đầu vào, với tần suất sử dụng tỷ lệ thuận với tần suất xuất hiện. Hình phạt từ vựng tăng theo số lần xuất hiện. Giá trị âm sẽ khuyến khích việc lặp lại từ vựng. Xem tài liệu

Loại
FLOAT
Giá trị mặc định
0.00
Phạm vi
-2.00 ~ 2.00
Hình phạt tần suất
frequency_penalty

Cài đặt này điều chỉnh tần suất mà mô hình lặp lại các từ cụ thể đã xuất hiện trong đầu vào. Giá trị cao hơn làm giảm khả năng lặp lại này, trong khi giá trị âm tạo ra hiệu ứng ngược lại. Hình phạt từ vựng không tăng theo số lần xuất hiện. Giá trị âm sẽ khuyến khích việc lặp lại từ vựng. Xem tài liệu

Loại
FLOAT
Giá trị mặc định
0.00
Phạm vi
-2.00 ~ 2.00
Giới hạn phản hồi một lần
max_tokens

Cài đặt này xác định độ dài tối đa mà mô hình có thể tạo ra trong một lần phản hồi. Việc đặt giá trị cao hơn cho phép mô hình tạo ra những phản hồi dài hơn, trong khi giá trị thấp hơn sẽ giới hạn độ dài của phản hồi, giúp nó ngắn gọn hơn. Tùy thuộc vào các tình huống ứng dụng khác nhau, điều chỉnh giá trị này một cách hợp lý có thể giúp đạt được độ dài và mức độ chi tiết mong muốn của phản hồi. Xem tài liệu

Loại
INT
Giá trị mặc định
--
Mức độ suy luận
reasoning_effort

Cài đặt này được sử dụng để kiểm soát mức độ suy luận của mô hình trước khi tạo câu trả lời. Mức độ thấp ưu tiên tốc độ phản hồi và tiết kiệm Token, trong khi mức độ cao cung cấp suy luận đầy đủ hơn nhưng tiêu tốn nhiều Token hơn và làm giảm tốc độ phản hồi. Giá trị mặc định là trung bình, cân bằng giữa độ chính xác của suy luận và tốc độ phản hồi. Xem tài liệu

Loại
STRING
Giá trị mặc định
--
Phạm vi
low ~ high

Mô hình liên quan

Meta

Llama 3.3 70B

llama-3.3-70b-versatile
Mô hình ngôn ngữ lớn Meta Llama 3.3 (LLM) đa ngôn ngữ là mô hình tạo ra dựa trên 70B (đầu vào/đầu ra văn bản) đã được huấn luyện và điều chỉnh theo chỉ dẫn. Mô hình thuần văn bản Llama 3.3 được tối ưu hóa cho các trường hợp hội thoại đa ngôn ngữ và vượt trội hơn nhiều mô hình trò chuyện mã nguồn mở và đóng khác trên các tiêu chuẩn ngành thông thường.
128K
Meta

Llama 3.2 11B Vision (Preview)

llama-3.2-11b-vision-preview
Llama 3.2 được thiết kế để xử lý các nhiệm vụ kết hợp dữ liệu hình ảnh và văn bản. Nó thể hiện xuất sắc trong các nhiệm vụ mô tả hình ảnh và hỏi đáp hình ảnh, vượt qua rào cản giữa tạo ngôn ngữ và suy luận hình ảnh.
8K
Meta

Llama 3.2 90B Vision (Preview)

llama-3.2-90b-vision-preview
Llama 3.2 được thiết kế để xử lý các nhiệm vụ kết hợp dữ liệu hình ảnh và văn bản. Nó thể hiện xuất sắc trong các nhiệm vụ mô tả hình ảnh và hỏi đáp hình ảnh, vượt qua rào cản giữa tạo ngôn ngữ và suy luận hình ảnh.
8K
Meta

Llama 3.1 8B

llama-3.1-8b-instant
Llama 3.1 8B là một mô hình hiệu suất cao, cung cấp khả năng sinh văn bản nhanh chóng, rất phù hợp cho các tình huống ứng dụng cần hiệu quả quy mô lớn và tiết kiệm chi phí.
128K
Meta

Llama 3.1 70B

llama-3.1-70b-versatile
Llama 3.1 70B cung cấp khả năng suy luận AI mạnh mẽ hơn, phù hợp cho các ứng dụng phức tạp, hỗ trợ xử lý tính toán cực lớn và đảm bảo hiệu quả và độ chính xác cao.
128K