Gemini 2.0: o modelo de IA mais avançado da Google já chegou
A inteligência artificial está a tornar-se cada vez mais parte integrante do dia-a-dia dos utilizadores. As empresas tecnológicas envolvidas nesta corrida estão a apostar fortemente as suas fichas no desenvolvimento de novos modelos de IA, mais avançados e com melhor desempenho. A Google, uma das gigantes tecnológicas, destaca-se nesta área e já lançou o seu modelo de IA mais avançado até à data: o Gemini 2.0 Flash. Conhece todas as novidades.
Gemini 2.0 Flash
O Gemini 2.0 Flash é a nova versão do modelo de IA da Google, uma evolução do Gemini 1.5 Flash. Esta nova versão apresenta melhorias significativas de desempenho, sendo duas vezes mais rápida que o Gemini 1.5 Pro em testes de referência importantes.
Principais características e novidades do Gemini 2.0 Flash:
- Velocidade: Duas vezes mais rápido que o Gemini 1.5 Pro.
- Suporte Multimodal Aprimorado: Suporta entradas e saídas multimodais, ou seja, processa e gera texto, imagens, vídeo e áudio. Uma novidade importante é a capacidade de gerar imagens combinadas com texto e converter texto em áudio em vários idiomas de forma natural.
- Integração com Ferramentas Externas: Consegues integrar ferramentas externas como a Pesquisa Google, execução de código e funções de terceiros, ampliando as capacidades dessas ferramentas.
- Disponibilidade: Atualmente, está disponível como versão experimental para programadores através da API Gemini no Google AI Studio e no Vertex AI. A versão geral está prevista para janeiro, com outras versões em desenvolvimento.
- API Multimodal Live: A Google também introduziu a API Multimodal Live, que permite a entrada de áudio e streaming de vídeo em tempo real, além da combinação simultânea de ferramentas, abrindo novas possibilidades para aplicações dinâmicas e interativas.
Gemini 2.0 já disponível
Se és utilizador do Gemini Advanced já podes aceder a uma versão otimizada para o chat do Flash Experimental 2.0, disponível nas versões desktop e web mobile, e em breve na aplicação móvel Gemini.
Além disso, a Google irá expandir a utilização do Gemini 2.0 para mais produtos no início do próximo ano, ampliando as suas funcionalidades para um público mais vasto.
Google Gemini 2.0 e os projetos em curso
A Google está a expandir a sua IA integrada com o Gemini 2.0, a vários projetos experimentais. Eis os principais destaques:
- Projeto Astra: Assistente multimodal com melhor diálogo, uso integrado de ferramentas (Google Maps, Pesquisa e Lens), memória personalizada e baixa latência. Está a ser testado em dispositivos Android e em protótipos de óculos.
- Projeto Mariner: Um agente para navegadores que compreende e interage com elementos web, permitindo realizar tarefas complexas. Em testes, destacou-se no benchmark WebVoyager, embora precise de melhorias na precisão e velocidade.
- Jules: Um assistente de programação experimental, integrado no GitHub, que ajuda a planear e executar tarefas sob supervisão.
- Agentes em jogos: Com IA a partir do Gemini 2.0, estes agentes auxiliam jogadores em tempo real, colaborando com empresas como a Supercell.
- A Google também explora o uso do Gemini 2.0 na robótica, apontando para um futuro onde agentes de IA poderão interagir com o mundo físico.
Segundo a Google, o foco em segurança e ética continuam como pilar central. As medidas tomadas pela gigante das pesquisas incluem controlos de privacidade, mitigação de riscos e ferramentas de treino para prevenir uso indevido e proteger os utilizadores. Estes projetos em curso refletem uma abordagem cautelosa e responsável no avanço da tecnologia de agentes de IA.
Conclusão
Em resumo, o Gemini 2.0 Flash apresenta avanços significativos em velocidade, capacidades multimodais e integração com ferramentas externas, prometendo ser uma ferramenta poderosa para programadores e abrindo caminho para novas aplicações interativas. Além disso, vários projetos integrados com o Gemini estão em desenvolvimento visando não só o avanço das tecnologias IA, mas também assegurar a segurança e certos princípios de ética.
Vê mais no Droid Reader: