DeepSeek vydal vylepšený model V3
DeepSeek vydal vylepšenou verzi modelu V3, která kombinuje špičkový výkon s otevřenou licencí a nízkými nároky na hardware.
Čínský AI startup DeepSeek bez velkého humbuku zveřejnil novou verzi svého modelu V3-0324, který je díky architektuře Mixture-of-Experts a otevřené MIT licenci dostupný široké veřejnosti – a to i na výkonnějších domácích počítačích, jako je Apple Mac Studio. Nová verze přináší lepší výkony v oblasti matematiky a programování, a zároveň snižuje výpočetní nároky tím, že aktivuje pouze 37 miliard parametrů na token. Přechod na otevřenou licenci je dalším krokem k větší demokratizaci vývoje AI modelů. Zároveň se spekuluje o blížícím se vydání verze R2, které by mohlo výrazně změnit poměry na AI scéně.