Mistral - premiera nowego multimodalnego modelu Pixtral 12B

Jakub NorkiewiczJakub Norkiewicz
środa 23:262 min czytania

Nowy model Pixtral 12B jest dostępny. Jest to pierwszy multimodalny model językowy od francuskiego start-upu Mistral. W inpucie przyjmuje tekst i obraz.

Mistral

Wolisz posłuchać? Kliknij w poniższy przycisk i posłuchaj artykułu.

Elevenlabs AudioNative Player

Mistral AI wkracza na arenę modeli multimodalnych z Pixtral 12B

Francuski startup Mistral AI, jeden z czołowych europejskich graczy w dziedzinie sztucznej inteligencji, zaprezentował dziś swój pierwszy model multimodalny o nazwie Pixtral 12B. To przełomowy krok dla firmy, która do tej pory koncentrowała się wyłącznie na modelach językowych.

Pixtral 12B to model o 12 miliardach parametrów, zajmujący 24 GB na dysku. Pixtral 12B został zbudowany na bazie tekstowego modelu Nemo 12B i posiada zdolność przetwarzania zarówno tekstu, jak i obrazów.

Główną funkcjonalnością nowego modelu jest możliwość analizy dowolnej liczby obrazów o różnych rozmiarach, przy jednoczesnym przetwarzaniu zapytań tekstowych. Użytkownicy mogą zadawać pytania dotyczące treści obrazów, podając ich adresy URL lub kodując je w formacie base64. Według zapewnień firmy, Pixtral 12B powinien być w stanie wykonywać takie zadania jak opisywanie obrazów czy liczenie obiektów na zdjęciach.

Model jest dostępny do pobrania za pośrednictwem linku torrent oraz przez społeczność na platformie Hugging Face. Pixtral 12B został udostępniony na licencji Apache 2.0, co oznacza brak ograniczeń w zakresie pobierania, dostrajania i wykorzystania modelu.

Prezentacja Pixtral 12B następuje krótko po tym, jak Mistral AI pozyskał 645 milionów dolarów finansowania, co podniosło wycenę firmy do 6 miliardów dolarów. Startup, w którym mniejszościowy udział posiada Microsoft, jest postrzegany jako europejska odpowiedź na OpenAI. Strategia Mistral AI opiera się na udostępnianiu darmowych, „otwartych” modeli, oferowaniu płatnych wersji zarządzanych tych modeli oraz świadczeniu usług konsultingowych dla klientów korporacyjnych.

Firma konsekwentnie rozwija swoje portfolio, oferując modele takie jak Mistral Large 2 czy Mixtral 8x22B.

Choć dokładne możliwości Pixtral 12B pozostają do zweryfikowania przez społeczność developerów, jego premiera stanowi ważny krok w kierunku demokratyzacji dostępu do modeli multimodalnych. Mistral AI konsekwentnie realizuje swoją strategię, umacniając pozycję na dynamicznie rozwijającym się rynku sztucznej inteligencji.

Całość na surowo została zrelacjonowana przez użytkownika @swyx.io na portalu X.com.