6月15日|當地時間6月14日,英偉達開源Nemotron-4 340B(3400億參數)系列模型。據英偉達介紹,開發人員可使用該系列模型生成合成數據,用於訓練大型語言模型(LLM),用於醫療保健、金融、製造、零售和其他行業的商業應用。Nemotron-4 340B包括基礎模型Base、指令模型Instruct和獎勵模型Reward。英偉達使用了9萬億個token(文本單位)進行訓練。Nemotron-4 340B-Base在常識推理任務,如ARC-c、MMLU和BBH基準測試中,可以和Llama-3 70B、Mixtral 8x22B和Qwen-2 72B模型媲美。
新聞來源 (不包括新聞圖片): 格隆匯