Velvet cresce: explore a nova geração de modelos made in Italy
Inteligência Artificial
1 dezembro 2025
A família Velvet está crescendo. A IA totalmente desenvolvida pela Almawave na Itália está se expandindo com dois novos modelos e versões aprimoradas dos existentes — fortalecendo o panorama europeu de Large Language Models e oferecendo IA acessível, multilíngue, poderosa e adaptável a uma ampla variedade de casos de uso.
Falamos sobre o Velvet 25B e o Velvet Speech 2B, além da nova versão do Velvet 2B, ainda mais compacta e eficiente.
Esses novos modelos aumentam as capacidades de processamento de texto de toda a família Velvet, facilitando o manuseio de documentos longos e complexos graças à capacidade de análise significativamente ampliada.
Velvet não é apenas um modelo, mas uma família completa de modelos projetados para oferecer soluções escaláveis que podem se adaptar a diferentes necessidades em termos de desempenho, caso de uso, infraestrutura e cobertura linguística.
Neste artigo, exploraremos os recursos de cada modelo, destacaremos como eles diferem dos já estabelecidos e examinaremos como a empresa conduz um projeto firmemente baseado em sustentabilidade, especialização e inovação.
Modelos maiores, menor impacto
Uma das escolhas centrais do design da Velvet é combinar alto desempenho com uma arquitetura deliberadamente leve.
Essa abordagem, já evidente nos modelos 14B e 2B, agora se torna ainda mais pronunciada: em vez de focar apenas em modelos cada vez maiores, a Almawave também investe em versões mais compactas e de alta qualidade, que oferecem eficiência, consistência e rapidez.
O benefício é duplo: menor consumo de energia e redução de custos operacionais, sem sacrificar a qualidade das respostas ou a capacidade de lidar com textos complexos.
Aqui, “compacto” definitivamente não significa limitado: modelos como 2B e 2B 1.5 oferecem fortes capacidades de raciocínio e análise multilíngue de textos, tudo com uma infraestrutura menor.
Não é coincidência que os novos modelos Velvet sejam LMs compactos: arquiteturas desenhadas para trabalhar de forma eficiente com recursos limitados. Isso significa que eles podem rodar em uma única GPU — um processador gráfico comum em muitos servidores — reduzindo tanto o consumo de energia quanto os custos operacionais.
Na prática, isso torna a IA acessível não apenas a grandes empresas, mas também a administrações públicas locais, pequenas e médias empresas e equipes com infraestrutura enxuta.
Dentro da família Velvet, há modelos que podem ser executados na nuvem e outros que podem ser implementados localmente, diretamente nos servidores da organização. Isso oferece às empresas com requisitos rígidos de controle de dados a opção de manter tudo internamente, enquanto aquelas que buscam maior flexibilidade em desempenho e escalabilidade podem optar pela nuvem.
Necessidades em mudança, modelos em mudança: por que a diversificação é essencial
Administração Pública, saúde, segurança, finanças e transportes são apenas algumas das áreas em que os modelos Velvet encontram aplicação.
Em vez de desenvolver um modelo único, a Almawave optou por criar modelos diferentes para necessidades diferentes, suficientemente flexíveis para se adaptarem facilmente a qualquer cenário, desde os mais estruturados até os mais específicos.
Os modelos Velvet estão, de fato, todos prontos para personalização (bespoke ready). Isso significa que eles se adaptam rapidamente a diferentes setores usando dados e terminologia específicos. Na prática, partem de uma base geral já sólida e podem ser especializados e treinados para qualquer contexto de uso, mantendo coerência, precisão e conformidade.
Dessa forma, a entidade ou empresa pode escolher o modelo mais adequado com base em suas necessidades e no seu setor de atuação.
Por exemplo, quem precisa usar IA em pequenos dispositivos em contextos de nicho deverá recorrer a modelos enxutos, altamente performantes, mas rápidos e leves, como o Velvet 2B.
Esse tipo de modelo oferece, de fato, a grande vantagem de poder ser re-treinado facilmente para realizar tarefas e atividades sempre diferentes.
Já analisamos as características dos modelos 14B e 2B, mas de que forma os novos modelos no mercado se diferenciam?
Velvet 25B: o maior modelo da família
25 bilhões de parâmetros: a capacidade de lidar da melhor forma com documentos complexos
O Velvet 25B se destaca principalmente em cenários de longo contexto, ou seja, quando precisa lidar com textos muito longos, graças a uma arquitetura projetada para manter altas capacidades de atenção.
O modelo, de fato, é baseado no uso de 25 bilhões de parâmetros, quase o dobro do 14B.
O que isso significa? Se comparássemos a um cérebro, poderíamos dizer que ele pode contar com 25 bilhões de conexões neurais para relacionar palavras e informações, fornecendo respostas mais coerentes e detalhadas.
Mas não se trata apenas de maior confiabilidade. O número de parâmetros também influencia fortemente a aprendizagem de padrões mais sutis nos dados, úteis para identificar nuances e conexões do conteúdo.
Graças à sua janela de contexto particularmente ampla (128.000 tokens), é capaz de analisar documentos como textos jurídicos, dossiês científicos ou atos legislativos, garantindo coerência e precisão mesmo na análise de partes do texto muito distantes entre si.
Para o Velvet 25B foi utilizado um conjunto de dados de treinamento maior do que o do 14B: estamos falando de 7 trilhões de dados.
Um cuidadoso processo de filtragem e limpeza dos dados permitiu reduzir duplicações, ruídos e conteúdos de baixa qualidade, melhorando a estabilidade e a precisão das respostas.
O aumento do dataset foi acompanhado por especializações de domínio com muitos exemplos direcionados: saúde, direito europeu e administração pública, educação e cultura, manufatura, indústria e atendimento ao cliente. Dessa forma, o modelo experimenta mais casos reais e terminologias de setor, compreendendo melhor os contextos e produzindo outputs mais pertinentes.
Raciocínio multietapa dinâmico e agentic orchestration
Com o Velvet 25B, as funcionalidades existentes são potencializadas, ao mesmo tempo em que é introduzida uma novidade importante: o raciocínio multietapa dinâmico (thinking).
O que isso significa? Significa que o modelo tem a capacidade de decidir sozinho quanto precisa “pensar” sobre uma solicitação e quais passos seguir, em vez de responder imediatamente.
Em termos operacionais, o modelo:
-
divide uma solicitação em etapas intermediárias coerentes;
-
adapta o número e a natureza das etapas à complexidade da tarefa;
-
realiza uma autoverificação parcial antes de entregar o output.
Essa abordagem permite um gerenciamento mais sólido de atividades complexas (por exemplo, análise de documentos extensos, cruzamento de fontes, verificação de dados e referências normativas), com benefícios em termos de coerência, rastreabilidade do raciocínio e confiabilidade do resultado.
Para direcionar essas capacidades a contextos empresariais, o Velvet utiliza técnicas de pós-treinamento, incluindo reinforcement learning, voltadas a guiar o processo decisório do modelo, reduzindo iterações desnecessárias e aumentando a pertinência em relação ao caso de uso.
Outro elemento distintivo é o agentic orchestration: a capacidade do sistema de selecionar e coordenar agentes ou ferramentas especializadas (por exemplo, para extração de dados, consulta a bases documentais, síntese, controle de qualidade) e integrar suas contribuições em uma única resposta. Isso resulta em eficiência operacional e maior controle do fluxo de trabalho, especialmente em cenários que exigem múltiplas competências e etapas sequenciais.
Um modelo paneuropeu que fala 24 línguas
Em comparação com modelos anteriores, o 25B também se destaca pelo desempenho linguístico.
Ele é capaz de lidar com todas as 24 línguas europeias e, ao contrário de concorrentes, não toma o inglês como língua de referência, mas utiliza metodologias que garantem qualidade e coerência mesmo para idiomas menos falados.
Integração pronta para uso com AIWave
O Velvet 25B está integrado nativamente ao AIWave, a plataforma multiagente da Almawave que já utiliza várias versões fine-tuned do Velvet 14B.
A plataforma inclui múltiplas soluções verticais prontas para uso, está disponível em cloud e on premise e permite a criação de agentes conversacionais em modo no-code/low-code.
Velvet Speech 2B: usar a voz para dialogar em contextos multilíngues
Velvet Speech 2B: o primeiro modelo multimodal da família Velvet, capaz de integrar texto e voz em um único sistema
O seu surgimento não é casual, mas sim fruto da experiência e da competência acumuladas ao longo de mais de 10 anos nos nossos laboratórios especializados em tecnologias de reconhecimento de voz, que encontram aplicação bem-sucedida no campo dos LLM.
O Speech 2B mantém as características do 2B textual, sendo rápido e leve, com a adição de novas funcionalidades:
-
Automatic Speech Recognition (ASR)
-
Spoken Query & Question Answering
-
Interação Vocal, com o mesmo desempenho do modelo textual, garantindo que a resposta seja sempre coerente, independentemente de a pergunta ser feita por texto ou por voz.
O Speech 2B é capaz de reconhecer e traduzir a fala em tempo real, compreender e responder em conversas mistas italiano-inglês (tradução falada com switching) e integra funções de speech emotion recognition, ou seja, classificação das emoções na voz.
Na prática, a entrada pode ser textual ou vocal, enquanto a saída permanece textual.
Essas novas capacidades do modelo abrem portas para inúmeros usos em diversos setores.
Por exemplo, na Administração Pública, ele poderia ser utilizado de forma eficaz para gravações de conselhos municipais ou sessões públicas, transformando-as em relatórios textuais, com resumo e pontos-chave.
No setor de saúde, o modelo poderia ser útil em hospitais para pré-triagem: o paciente responde a perguntas estruturadas e o sistema preenche uma ficha de pré-triagem baseada nas respostas. O médico, por sua vez, poderia se beneficiar de um relatório escrito do diálogo entre operador e paciente.
Velvet 2B: compacto, atualizado e pronto para o on-edge
Essa combinação torna o modelo ideal para levar a IA aonde é necessária, com latência mínima e máximo controle (privacidade e continuidade operacional).
O uso on-edge permite implementar o modelo em dispositivos ou gateways locais, em vez de data centers remotos e em cloud. Assim, pode ser usado em um PC compacto, servidor de filial, sensor industrial, quiosque, painel domótico, etc.
Esses são contextos onde há grande necessidade de proteger dados sensíveis de usuários e pacientes.
Por exemplo, o Velvet 2B seria a escolha adequada no setor de saúde, por exemplo em dispositivos portáteis de enfermaria que fornecem instruções passo a passo e síntese de protocolos, com os dados processados localmente.
Uma visão orientada a aplicações concretas
Com o Velvet, o objetivo da Almawave é levar a IA para processos reais, com soluções end-to-end capazes de atender necessidades específicas de Administração Pública, saúde, transportes, finanças, indústria e atendimento ao cliente.
Graças à plataforma multimodelo e multiagente AIWave, os modelos Velvet encontram aplicação natural em casos de uso complexos: análise e síntese documental, assistência a cidadãos e clientes, simplificação operacional e administrativa, pesquisa conversacional e navegação do conhecimento.

Os modelos Velvet estão evoluindo para oferecer respostas concretas às novas e cada vez mais complexas necessidades de cada setor, com o objetivo de otimizar processos internos, facilitar o diálogo entre empresas e pessoas e transformar a IA em uma ferramenta a serviço de toda a comunidade.
Quer saber o que o Velvet poderia fazer por você?