[NEW] Search for a job anonymously — check the details
Close
Mistral AI wydała nowe narzędzia — Codestral Mamba i MathΣtral

Mistral AI wydała nowe narzędzia — Codestral Mamba i MathΣtral

Mistral AI zaprezentowało dwa nowe produkty rozszerzające możliwości sztucznej inteligencji, w tym MathΣtral — wyspecjalizowany model do obliczeń matematycznych i badań naukowych, oraz Codestral Mamba — modele z otwartym kodem źródłowym do generowania kodu.

Codestral Mamba

Codestral Mamba to model 7B, który oferuje możliwość kontekstowego wyszukiwania do 256K tokenów. Specjalizuje się w generowaniu kodu i jest dostępny na licencji Apache 2.0. Obsługuje języki programowania takie jak Python, Java, JavaScript, C, C++, Swift, Fortran i Bash.

Modele Mamba mają zaletę liniowego czasu odpowiedzi i teoretyczną możliwość modelowania sekwencji o nieskończonej długości. Dzięki temu użytkownicy mogą otrzymywać szybkie odpowiedzi, niezależnie od długości danych wejściowych.

Codestral Mamba można wdrożyć za pomocą mistral-inference SDK, który opiera się na referencyjnych implementacjach z repozytorium Mamba na GitHubie. Model można również wdrożyć za pomocą TensorRT-LLM lub pobrać surowe wagi z HuggingFace.

MathΣtral

Dla wygody testowania, Codestral Mamba jest dostępna na platformie La Plateforme (codestral-mamba-2407), obok swojej „starszej siostry”, Codestral 22B.

To specyficzny model 7B, przeznaczony do rozwiązywania problemów matematycznych oraz odkryć naukowych. Model ma 32K okno kontekstowe i jest udostępniony na licencji Apache 2.0.

Osiąga najnowocześniejsze w swojej kategorii rozmiarowej możliwości obliczeniowe w różnych standardowych testach branżowych (osiąga 56,6% w MATH oraz 63,47% w MMLU).

Współczynniki wag są umieszczone na HuggingFace. Mathstral można wypróbować za pomocą mistral-inference i dostosować za pomocą mistral-finetune.

MathΣtral jest dostępna do użytku i adaptacji za pomocą narzędzi Mistral AI.

Avatar
Nov 19

Google może zostać zmuszony do sprzedaży przeglądarki Chrome

Departament Sprawiedliwości USA (DOJ) zamierza wystąpić do sądu o nakaz zmuszający właściciela Google do sprzedaży przeglądarki internetowej Chrome.
0
Nov 18

Six rules to avoid delays in backend development

Hey there! I'm Catalin Dragutescu, a Full Stack Engineer at Railsware. Over the past six years, I've had the opportunity to work with engineering teams of various sizes. I've developed different growth strategies, tackled challenges, and prioritized tasks. I've seen both successes and setbacks. So I'm sure the topic of speeding up the development process interests everyone—from interns to seasoned developers. If you've encountered situations where hiring new developers doesn't increase productivity or large projects take too much time—keep reading. I'll share my own experience, discuss what strategies work and which don't, and talk about the aspects we considered when choosing a path to optimize development. So even if your primary focus isn't backend, you'll find this material useful.
0
Apr 18, 2023

Posada "prompt inżyniera" AI: 335 000 dolarów rocznie i brak wykształcenia technicznego

Zgodnie z ogłoszeniami firm aplikować mogą nawet osoby, które nie spełniają wszystkich kwalifikacji.
0

This site uses cookies to offer you a better browsing experience.

Find out more on how we use cookies and how to change cookie preferences in our Cookies Policy.

Customize
Save Accept all cookies