Cloud-Ace

Categories
Uncategorized

Google lança o mais recente modelo de IA “Gemini Pro” disponível gratuitamente para desenvolvedores no Vertex AI e Google AI Studio

Google lança o mais recente modelo de IA “Gemini Pro”
disponível gratuitamente para desenvolvedores no Vertex AI e Google AI Studio

Olá, bem vindo a mais um blog da CloudAce Brasil !

Em 6 de dezembro de 2023 (horário dos EUA), o mais recente modelo IA “Gemini” foi anunciado pelo Google. Este modelo será lançado em três tamanhos: “Ultra”, “Pro” e “Nano”, sendo que o “Ultra” já estava sendo disponibilizado em pré-visualização para algumas grandes empresas, e o “Nano” já havia começado a ser fornecido no “Pixel 8 Pro”.

Em seguida, em 13 de dezembro de 2023 (horário dos EUA), o Google anunciou que começou a fornecer uma pré-visualização gratuita do Gemini Pro para desenvolvedores e grandes empresas na forma de uma API no “Vertex AI”, uma ferramenta de desenvolvimento de AI gerada pelo Google Cloud, e no “Google AI Studio”. Isso torna possível a construção de “Agentes de AI de Geração Multimodal”.

Índice

1- Produção em larga escala de agentes de IA de alta qualidade com o Gemini Pro

2- O que a combinação de Gemini Pro e Vertex AI torna possível

3- Compensação para a saída do modelo de geração

1.Produção em larga escala de agentes de AI de alta qualidade com o Gemini Pro

O Google permite que os desenvolvedores personalizem e implementem o modelo Gemini através de duas ferramentas, o Vertex AI e o Google AI Studio. O Vertex AI é um serviço gerenciado, o que significa que você pode usá-lo sem ter que gerenciar ou configurar a infraestrutura para treinar modelos de AI ou executar aplicações. O Google AI Studio permite que os desenvolvedores configurem instâncias e treinem modelos por conta própria, tornando-o adequado para a construção de aplicações altamente personalizáveis. De qualquer forma, com o lançamento do Gemini Pro, é possível criar aplicações inovadoras e distintas que podem lidar com a entrada e saída de informações multimodais, como texto, código, imagens, áudio e vídeo.

No momento, um texto de janela de 32K está ativado e suporta entrada e saída de texto. Além disso, ao utilizar o Gemini Pro Vision, que foi anunciado desta vez para a função multimodal, você também pode suportar a entrada de imagens, não apenas texto.

2.O que a combinação de Gemini Pro e Vertex AI torna possível

1.Seleção e uso de diversos modelos

Ao usar o Vertex AI, os desenvolvedores podem escolher entre mais de 130 modelos de alta qualidade selecionados, incluindo o Gemini Pro do Google, de acordo com suas necessidades de desenvolvimento. Esses modelos fornecem APIs que podem ser facilmente integradas às aplicações.

2. Personalização do modelo

Além disso, os desenvolvedores podem utilizar seu conhecimento especializado e dados específicos para ajustar o comportamento do modelo através do design de prompts, ajuste de adaptadores (LoRA) e destilação, e também podem melhorar o modelo a partir do feedback dos usuários (RLHE).

3.Expansão do modelo

Usando as Extensões Vertex AI e conectores, você pode conectar o Gemini Pro a APIs externas, fontes de dados e funções de código base para adaptá-lo a contextos e casos de uso específicos. Além disso, oferecemos uma função de “ancoragem” para melhorar a precisão e relevância da saída do modelo com base nas fontes de dados da empresa.

4.Gerenciamento e dimensionamento do modelo

A nova função “Automatic Side by Side (Auto SxS)” permite comparar e avaliar modelos automaticamente. Isso permite avaliar modelos mais rapidamente e de forma mais econômica do que a avaliação manual de modelos.

5.Construção de agentes em ambientes de baixo código/sem código

Usando o Vertex AI, desenvolvedores de todos os níveis de habilidade podem criar agentes de IA envolventes usando o Gemini Pro em algumas horas a alguns dias. No futuro próximo, o Gemini Pro será capaz de melhorar as funções de resumo de pesquisa e geração de respostas do Vertex AI como uma opção e também estará disponível para uso em pré-visualização como um modelo base para agentes de voz e chat conversacionais.

6.Fornecimento de Inovação Responsável

Usando ferramentas de IA responsáveis, como os filtros de segurança do Vertex AI e a API de moderação de conteúdo, você pode prevenir a geração de conteúdo inadequado.

7.Proteção de Dados

Os clientes podem continuar a controlar seus próprios dados, e o Google não usará os dados dos clientes para treinar modelos. O Vertex AI oferece vários mecanismos, como Chaves de Criptografia Gerenciadas pelo Cliente e Controles de Serviço VPC, que permitem aos clientes gerenciar seus próprios dados de forma centralizada.

3.Compensação para a saída do modelo de geração

O Google adotou uma abordagem dupla de compensação de direitos autorais para que os clientes possam usar produtos de IA generativo com confiança. Isso fornece compensação para a saída do modelo de PaLM 2 e Vertex AI Imagen, e inclui compensação para reivindicações relacionadas ao uso de dados de treinamento. Quando a API Gemini se tornar geralmente disponível, o escopo da compensação será expandido.

Com este anúncio, os desenvolvedores poderão utilizar a tecnologia IA de ponta do Google para construir aplicações que resolvam problemas complexos enfrentados por empresas e organizações de forma mais rápida e fácil. A combinação de Gemini Pro e Vertex AI será uma ferramenta poderosa para maximizar o potencial da IA e criar novos valores.

 

Fonte : https://cloud.google.com/blog/products/ai-machine-learning/gemini-support-on-vertex-ai?hl=en

 

Categories
Uncategorized

Explicando em 5 minutos o que a IA de geração multimodal “Gemini” do Google pode fazer comparado com o ChatGPT

Explicando em 5 minutos - O que a “Gemini” do Google pode fazer comparado com o ChatGPT

Neste artigo, vamos explicar em um formato de 5 minutos de leitura sobre a IA de geração multimodal “Gemini” do Google, que foi anunciado em 6 de dezembro de 2023.

Índice

1-O que é Gemini?

2-O que é possível fazer com Gemini – O que é multimodal ?

3-Diferenças e comparações entre Gemini e ChatGPT

4-Planos futuros e como usar o Gemini

5-Conclusão

 

1. O que é Gemini?

O “Gemini” anunciado pelo Google em 6 de dezembro de 2023 é um modelo de IA generativa multimodal de ponta. Este modelo pode entender vários tipos de dados, como texto, imagem, áudio, vídeo e código, e combinar e manipular esses dados. Isso permite que ele lide com tarefas complexas que os modelos de IA generativa anteriores tinham dificuldade.

O Gemini será lançado em três modelos.

Gemini Ultra… Um modelo que oferece o mais alto nível de desempenho em uma ampla gama de campos, incluindo tarefas muito complexas, especialmente tarefas de inferência e multimodais.

Gemini Pro… Um modelo versátil que é otimizado para uma ampla gama de tarefas em termos de custo e latência.

Gemini Nano… Um modelo eficiente otimizado para tarefas em dispositivos, como smartphones ou tablets.

Fonte da imagem: https://deepmind.google/technologies/gemini/#introduction

2.O que é possível com Gemini – O que é multimodal ?

O Gemini, com suas habilidades multimodais, é esperado para trazer mudanças inovadoras em uma ampla gama de indústrias.

Multimodal refere-se à capacidade de uma IA de lidar com vários tipos de dados ao mesmo tempo. O Gemini aprende esses tipos de dados do zero e permite uma geração mais sofisticada usando dados multimodais.

A capacidade de lidar com texto, áudio, imagem, vídeo, etc. como entrada e texto e imagem como saída de forma entrelaçada (Interleave) é uma característica importante que outros IAs generativo não possuem.

Além disso, tarefas como resumir documentos complexos, extrair insights, responder a perguntas complexas baseadas em texto e imagens, e até gerar código de programação avançado são possíveis graças à avançada capacidade de inferência do Gemini. Em particular, em campos como pesquisa científica e análise financeira, será possível extrair apenas as informações necessárias e importantes de uma grande quantidade de dados.

Além disso, o Gemini está planejado para ser otimizado para tarefas em dispositivos móveis, melhorando drasticamente o desempenho de aplicações diárias como reconhecimento de voz e processamento de imagens, tornando nossas vidas mais convenientes e produtivas.

 

3.Diferenças e comparações entre Gemini e ChatGPT

Anunciado em setembro de 2023, como representado pelo GPT-4V, o ChatGPT também pode lidar com tarefas multimodais. No entanto, não foi divulgado como a implementação interna é feita. Pode ser possível que ele esteja realizando multimodal combinando tecnologias existentes (por exemplo, a capacidade de OCR imagens em strings e interpretá-las em LLM).

Por outro lado, o Gemini foi projetado desde o início para lidar com informações multimodais, e ao treiná-lo com um conjunto de dados multimodais desde o estágio de treinamento, ele se tornou um modelo que pode lidar nativamente com informações multimodais na entrada e saída.

“Os modelos Gemini são treinados para acomodar entradas de texto entrelaçadas com uma ampla variedade de entradas de áudio e visuais, como imagens naturais, gráficos, capturas de tela, PDFs e vídeos, e eles podem produzir saídas de texto e imagem (veja a Figura 2). A codificação visual dos modelos Gemini é inspirada em nosso próprio trabalho fundamental em Flamingo (Alayrac et al., 2022), CoCa (Yu et al., 2022a) e PaLI (Chen et al., 2022), com a importante distinção de que os modelos são multimodais desde o início e podem produzir imagens nativamente usando tokens de imagem discretos (Ramesh et al., 2021; Yu et al., 2022b).”

Além disso, gostaríamos de apresentar o teste de benchmark do Gemini e GPT4 em termos de desempenho de processamento de tarefas multimodais e tarefas de texto, que estão postados no site oficial do Google DeepMind, o instituto de pesquisa de inteligência artificial do Google.

O desempenho multimodal do Gemini supera ligeiramente o GPT-4, especialmente em tarefas de reconhecimento de imagem (VQA2, TextVQA), e mostra uma diferença de mais de 2,5% na compreensão de documentos (DocVQA). Por outro lado, no caption de vídeo (VATEX), o Gemini é cerca de 6,7 pontos mais alto, e na tradução de voz (CoVoST 2), o Gemini Pro é 10,2 pontos mais alto que o Whisper v2 do GPT-4.

Nos benchmarks baseados em texto, o Gemini Ultra supera o GPT-4 em tarefas de conhecimento geral (MMLU), inferência (Big-Bench Hard) e leitura (DROP), mas o GPT-4 está no topo em inferência de senso comum (HellaSwag). Em matemática (GSM8K), ambos mostram resultados semelhantes, e em geração de código (HumanEval, Natural2Code), o Gemini mostra maior precisão.

O score HellaSwag é pior que o GPT-4, mas no relatório técnico (https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf), a possibilidade de contaminação de dados é apontada.

MMLU é dito ser um benchmark abrangente para LLM, e há dados que afirmam que especialistas humanos em campos específicos têm 89,8% (referência:https://arxiv.org/abs/2009.03300), e registrou pela primeira vez no mundo 90,0% nos dados de teste.

Em outras palavras, não seria exagero dizer que um IA como um super-homem com conhecimento e habilidades de resolução de problemas superiores aos de especialistas em todos os campos, como medicina, física, matemática e direito, apareceu.

MMLU… Um dos métodos mais comuns para testar o conhecimento e a capacidade de resolução de problemas de um modelo de AI.

Em conclusão, ficou claro que o Gemini supera o GPT-4 e o GPT-4V em quase todos os itens de tarefa e é seguro dizer que ele tem um alto potencial para processar tarefas multimodais.

 

 

Referência: https://deepmind.google/technologies/gemini/#capabilities

Imagem fonte: https://deepmind.google/technologies/gemini/#capabilities

4.Planos futuros e como usar o Gemini

O Gemini será integrado a vários produtos e serviços do Google no futuro, criando muitos pontos de contato onde os usuários podem interagir diretamente.

Serviços Google (suporte sequencial)

O Gemini será integrado à pesquisa e publicidade do Google, melhorando a precisão e relevância dos resultados da pesquisa para melhorar a experiência do usuário. Também é esperado que seja usado para personalizar e otimizar conteúdo publicitário. Ele também será disponibilizado em Chrome, Duet AI, Google Maps, etc.

 

Google Pixel

No mais recente modelo da série Google Pixel, Pixel 8 Pro, o Gemini Nano é projetado para funcionar no dispositivo, proporcionando uma nova experiência ao usuário. Por exemplo, reconhecimento de voz, organização automática de fotos, apoio eficiente à comunicação, etc., tornam-se possíveis.

 

Google Bard

Integrando o Gemini Pro ao Bard, os usuários poderão utilizar uma IA de conversação mais avançada para editar textos, brainstorming , planejamento, etc. Isso ajuda os usuários a trabalhar de maneira mais criativa e eficiente. Além disso, espera-se que a expansão para vários tipos de dados multimodais, novas regiões e idiomas seja adicionada nos próximos meses. Em 2024, o Bard Advanced, que integra o Gemini Ultra e oferece a experiência de IA mais avançada, também está planejado para ser lançado.

A versão em inglês do Bard foi lançada em mais de 170 países e regiões a partir de 6 de dezembro de 2023.

API para desenvolvedores (lançada em 13 de dezembro de 2023)

Através do Gemini API oferecido pelo Google AI Studio e Vertex AI, os desenvolvedores podem integrar o Gemini Pro em suas próprias aplicações e serviços. Isso permite que os desenvolvedores ofereçam recursos mais ricos e inteligentes aos seus usuários.

 

5.Conclusão

Com o advento do Gemini do Google, a utilização da IA generativa evoluirá para a próxima fase centrada no multimodal. Espera-se que esteja disponível no Brasil em breve, então fique atento.

Referência: https://japan.googleblog.com/2023/12/gemini.html

Google, Chrome, Google Pixel e Google Maps são marcas comerciais da Google LLC.

Categories
Uncategorized

Por que o Google Cloud é recomendado para o desenvolvimento de IA gerativa?

Por que o Google Cloud é recomendado
para o desenvolvimento de IA gerativa

Desde o advento do ChatGPT em 2022, serviços conhecidos como “IA gerativa”, como IA de diálogo que pode conversar como humanos e IA de geração de imagem que gera imagens a partir de texto, têm atraído muita atenção em todo o mundo. Grandes empresas e startups estão acelerando rapidamente o desenvolvimento de serviços que incorporam IA gerativa.

Embora a Amazon, a Microsoft e o Google, os três principais provedores de nuvem, tenham conquistado uma grande participação nos recursos de desenvolvimento de nuvem para aplicativos e sistemas de negócios, eles também começaram a fornecer os resultados de muitos anos de pesquisa no campo da IA gerativa como recursos. É considerado que isso fortalecerá sua posição como plataforma.

Neste artigo, apresentaremos as razões pelas quais o Google Cloud é recomendado para o desenvolvimento de IA gerativa e os casos de uso do desenvolvimento de IA gerativa usando o Google Cloud.

Índice

1)Você pode usar a avançada tecnologia de IA e aprendizado de máquina do Google

2)As empresas podem personalizar o modelo por conta própria

3)Serviços relacionados à IA gerativa estão sendo adicionados

4)Exemplos concretos de desenvolvimento de IA gerativa usando o Google Cloud

5)Resumo

1) Você pode usar a avançada tecnologia de IA e aprendizado de máquina do Google 

A primeira razão é que você pode usar a avançada tecnologia de IA e aprendizado de máquina fornecida pelo Google.

Existem muitas plataformas de nuvem que fornecem ferramentas de desenvolvimento de IA gerativa, incluindo AWS da Amazon e Azure da Microsoft, além do Google Cloud. No entanto, o Google Cloud possui tecnologia particularmente avançada de IA e aprendizado de máquina.

Uma das razões para isso é que o Google possui um dos maiores conjuntos de dados do mundo, cultivado por seu mecanismo de busca, o que permite treinar modelos de aprendizado de máquina avançados. Ao usar uma grande quantidade de dados para treinar o modelo, é possível fazer previsões e análises de alta precisão.

Além disso, o Google sempre lançou vários produtos avançados relacionados à IA e ao aprendizado de máquina. Por exemplo, em 2015, ele lançou o TensorFlow, um framework de aprendizado de máquina de código aberto que é usado por muitos engenheiros. Além disso, o popular serviço de IA de diálogo “ChatGPT” também se baseia no “Transformer”, um modelo de linguagem em larga escala que o Google lançou em 2017.

Dessa forma, o Google está liderando no campo da IA e do aprendizado de máquina. Ao usar os serviços do Google Cloud, você sempre pode usar a tecnologia mais recente.

 

2) As empresas podem personalizar o modelo por conta própria

A segunda razão é que as empresas podem personalizar e ajustar o modelo de IA gerativa de acordo com suas necessidades.

Ao usar o Model Garden do “Vertex AI” fornecido pelo Google Cloud, você pode selecionar o que precisa de uma ampla gama de modelos, incluindo o modelo básico PaLM, modelos pré-treinados, modelos de código aberto e modelos de terceiros no futuro, na interface do usuário. Além disso, o modelo selecionado não é apenas usado diretamente, mas também pode ser projetado e ajustado sem conhecimento de programação usando o Generative AI Studio.

Além disso, usando o recurso de ajuste fino do Vertex AI, você pode personalizar o modelo em si combinando seus próprios dados com o modelo de linguagem pré-treinado, tornando possível ajustar para tarefas específicas.

Com esses recursos, o Google Cloud permite a criação de modelos em desenvolvimento de IA gerativa com um bom equilíbrio de custo.

Há também o “Generative AI App Builder”, um serviço que permite construir chatbots e mecanismos de pesquisa para sua própria empresa sem conhecimento especializado em codificação. Ao utilizar este recurso, você poderá introduzir IA gerativa em seu negócio de maneira mais fácil. No Google Cloud, um ambiente onde mesmo aqueles sem conhecimento especializado em IA, aprendizado de máquina e programação podem facilmente desenvolver ferramentas de IA gerativa com uma interface amigável.

 

3) Serviços relacionados à IA gerativa estão sendo adicionados em grande número

A terceira razão é que novos serviços relacionados à IA gerativa estão sendo adicionados e atualizados no Google Cloud todos os dias.

Por exemplo, no “Google I/O 2023” realizado em maio de 2023, foram feitos vários anúncios de novos produtos relacionados à IA. Especificamente, foi anunciado que o avançado LLM* “PaLM 2”, que permite processamento rápido e eficiente, e o AI de diálogo “Bard”, que possui o PaLM 2, suportarão o portugues e mais de 20 linguagens de programação.

Além disso, no Generative AI Summit realizado pelo Google Cloud em 22 de agosto de 2023, foi anunciado que o grande modelo de linguagem “PaLM 2” e o modelo “Codey” para geração e complementação de código do Vertex AI agora suportam o portugues. Com isso, espera-se que a disseminação de aplicações de IA gerativa baseadas em portugues que utilizam o PaLM 2 e o Codey acelere no Brasil.

*LLM é um modelo de processamento de linguagem natural que foi treinado com uma grande quantidade de dados de texto. É capaz de classificação de texto, tradução, resumo, extração de informações, geração de texto, resposta a perguntas, etc.

Além disso, no Google I/O 2023, foi anunciado que a IA será incorporada à pesquisa do Google, permitindo que respostas textuais sejam exibidas para perguntas complexas, não apenas exibindo sites, e que o Gmail terá uma função chamada “Help me write” que sugere um texto apropriado quando você insere um assunto.

Como você pode ver, o Google está atualmente focando na IA gerativa. No futuro, espera-se que sejam anunciados produtos relacionados à IA ainda mais convenientes e de alto desempenho.

 

4) Exemplos concretos de desenvolvimento de IA gerativa usando o Google Cloud 

A partir daqui, gostaríamos de apresentar alguns casos de uso para ajudar você a visualizar melhor o desenvolvimento de IA gerativa usando o Google Cloud.

Construção de funcionalidade de pesquisa de conteúdo 

O primeiro caso de uso é a construção de funcionalidade de pesquisa de conteúdo. Isso pode ser particularmente útil para empresas de mídia.

Especificamente, você pode construir sua própria funcionalidade de pesquisa de conteúdo usando o produto “Generative AI App Builder” do Google Cloud. Este é um serviço que permite gerar chatbots e aplicações de pesquisa facilmente, mesmo sem conhecimento especializado em aprendizado de máquina.

Por exemplo, empresas de mídia que possuem uma grande quantidade de conteúdo podem usar o Generative AI App Builder para construir um mecanismo de funcionalidade de pesquisa de conteúdo. Isso permite que os usuários encontrem instantaneamente o conteúdo que estão procurando, como música, vídeos, blogs, etc. Além disso, se você construir um chatbot de conversação, poderá apresentar recomendações de conteúdo e serviços altamente personalizados.

Ao permitir que os usuários encontrem conteúdo relacionado instantaneamente, você pode aumentar o engajamento e a taxa de visualização.

Criação eficaz de catálogos de produtos

O segundo caso de uso é a criação eficaz de catálogos de produtos. Isso é particularmente útil para empresas de varejo que operam e-commerce.

Ao usar o Google Cloud, você pode combinar itens semanticamente semelhantes com dados não estruturados, como imagens e texto, e realizar pesquisas de imagens por texto e pesquisas de texto por imagens. Além disso, você pode fornecer resultados altamente precisos que entendem profundamente a intenção de pesquisa do usuário e recomendam produtos com alta precisão com base no comportamento do usuário que visita o site.

Para realizar essas funções, existem serviços como o serviço de reconhecimento de imagem “Vision AI”, o “Vertex AI Embeddings” que combina conteúdo semelhante, e o “Vertex AI Matching Engine” que armazena e classifica conteúdo.

Ao usar os produtos do Google Cloud, você pode gerar descrições de produtos apropriadas, categorizar e fazer recomendações de alta precisão. Como resultado, é possível esperar um aumento no envolvimento no comércio eletrônico.

Geração de novo conteúdo 

O terceiro caso de uso é a geração de novo conteúdo. Isso é especialmente útil em operações de marketing em todas as empresas.

O serviço do Google Cloud que ajuda na geração de conteúdo é o “Generative AI Studio”. Este é um serviço composto por “Imagen”, que gera imagens de alta precisão a partir de texto, e “PaLM API for Text”, que gera conteúdo a partir de algumas linhas de texto.

Ao utilizar essas funcionalidades, é possível gerar instantaneamente imagens e textos para anúncios eficazes, conteúdo de SNS e websites, e newsletters. Ao usar os produtos de IA gerativa do Google, é possível eficientizar até mesmo tarefas que requerem criatividade.

 

Descoberta e resumo de informações 

O quarto caso de uso é a descoberta e o resumo de informações. Isso é útil em uma ampla gama de aplicações, incluindo pesquisa, pesquisa de mercado e análise.

Especificamente, ao usar o “Enterprise Search” fornecido pelo “Generative AI App Builder”, você pode construir uma funcionalidade de pesquisa que fornece instantaneamente as informações necessárias a partir de grandes quantidades de dados internos em poucos minutos. Ao fazer uma pergunta em linguagem natural, você pode obter respostas em um formato fácil de entender a partir de vários tipos de dados, incluindo texto, imagens, vídeos, números e áudio, com base na compreensão da intenção do usuário.

Ao construir um mecanismo de pesquisa para sua própria empresa com o Enterprise Search, você não precisa mais ler grandes quantidades de documentos ao realizar pesquisas, pesquisas e análises. Além disso, ao utilizar esta funcionalidade, você também pode construir um sistema interno fácil de usar para os funcionários.

Melhorando a produtividade do desenvolvedor 

 O quinto caso de uso é melhorar a produtividade do desenvolvedor. O Google Cloud também oferece produtos que podem melhorar significativamente as tarefas de codificação dos engenheiros.

Por exemplo, usando o modelo básico “Codey” fornecido pelo Google Cloud, você pode gerar código apenas dando instruções em linguagem natural. Além disso, você pode receber sugestões para as próximas linhas de código digitando as primeiras linhas de código, ou pode fazer perguntas relacionadas ao código em um formato de conversação.

Ao usar o Codey, você pode melhorar a geração de código, a conclusão e a qualidade. Além de acelerar significativamente o trabalho dos desenvolvedores, também pode ajudar a eliminar a diferença de habilidades entre os engenheiros.

 

5) Resumo

Até aqui, apresentamos as vantagens do Google Cloud no desenvolvimento de IA gerativa. Use este artigo como referência para avançar no desenvolvimento de IA gerativa usando o Google Cloud e conectar isso à eficiência dos negócios e à criação de novos negócios.

 

 

Categories
Uncategorized

Desenvolvimento de aplicativos AI em minutos ?

Desenvolvimento de aplicativos AI em minutos!?
O que é o Google Generative AI App Builder ?

Olá, bem vindos a mais um blog da Cloud Ace Brasil !

 

Os serviços chamados de IA generativa, como o ChatGPT e o Gemini, estão atraindo muita atenção. Nesse meio tempo, várias plataformas de nuvem também estão lançando recursos para desenvolver IA generativa para empresas.

Nesta vez, apresentaremos as funções do ambiente de desenvolvimento de aplicativos AI “Generative AI App Builder” recentemente anunciado pelo Google, e as principais atualizações realizadas na plataforma de aprendizado de máquina “Vertex AI”.

Índice

  1. O que é o Generative AI App Builder
  2. Problemas resolvidos pelo Generative AI App Builder
  3. Duas funções adicionadas ao Vertex AI
  4. Produtos concorrentes da AWS, Azure e IBM
  5. Resumo
O que é o Generative AI App Builder

O Generative AI App Builder é um serviço para construir suas próprias ferramentas de IA, como o ChatGPT, para seus sistemas de TI e clientes. Ao usar o Generative AI App Builder, mesmo aqueles que não têm habilidades suficientes em aprendizado de máquina podem facilmente criar sua própria IA gerativa usando a tecnologia de pesquisa do Google.

As principais funções do Generative AI App Builder são divididas em “Conversational AI” e “Enterprise Search”. Vamos dar uma olhada mais de perto.

Conversational AI 

O primeiro é o Conversational AI (IA de conversação). Esta é principalmente uma função para desenvolver chatbots.

Até agora, ao desenvolver um chatbot, era necessário definir padrões de conversação manualmente com antecedência. Como as respostas são retornadas de algumas frases pré-configuradas, a resposta pode não corresponder à intenção da pergunta ou pode parecer mecânica.

Usando o Generative AI App Builder, você pode resolver esses problemas. No Conversation AI, dados complexos e de grande escala, como conversas por e-mail e chat, sites e documentos, são capturados, essas informações são sintetizadas e respostas naturais em texto são geradas imediatamente para consultas. Como resultado, o questionador pode obter respostas mais naturais e alinhadas com suas intenções de forma mais suave.

Além disso, o Conversation AI também pode se conectar a aplicativos e serviços de terceiros. Isso permite que você execute transações, como pagamentos de faturas, no chat, conecte-se a um agente humano conforme necessário e ofereça experiências além das informações.

Enterprise Search 

O segundo é o Enterprise Search. Este é um recurso de pesquisa de conversação que pode ser usado em sistemas de TI para clientes e funcionários de empresas.

O Enterprise Search é um serviço que pesquisa vários tipos de dados, como texto, imagens, vídeos, números e voz, e fornece resultados de pesquisa de alta qualidade. Em vez de simplesmente retornar informações mecanicamente, ele entende a intenção do usuário a partir do texto da consulta e resume a resposta de maneira fácil de entender. Além disso, ele pode extrair automaticamente informações particularmente importantes dos dados e retornar resultados personalizados.

Ao usar o Generative AI App Builder, você pode construir essa função de pesquisa avançada em minutos a horas, mesmo sem conhecimento de codificação.

 

Desafios resolvidos pelo Generative AI App Builder 

Existem muitos desafios que o Generative AI App Builder pode resolver. Aqui estão duas aplicações específicas.

Atendimento ao cliente via IA:

A primeira é a aplicação no atendimento ao cliente.

Por exemplo, se você usar o Generative AI App Builder para o atendimento ao cliente de uma loja online, quando um cliente desejar “alterar o pedido”, você poderá aconselhar a alteração do pedido para outros produtos apropriados apenas no chatbot ou realmente executar a transação. Tudo o que um humano precisa fazer é fazer o upload da imagem do produto, e o processamento subsequente pode ser deixado para a IA.

Na verdade, a grande loja de departamentos americana Macy’s conseguiu aumentar a receita por visita e obteve grandes resultados em termos de taxa de conversão usando a função IA do Google Cloud. Ao usar o Generative AI App Builder para o atendimento ao cliente, você pode esperar melhorar tanto o envolvimento do cliente quanto a produtividade do trabalho.

 

Aplicação em pesquisa e sistemas internos:

O segundo é a melhoria da produtividade do trabalho através da implementação em sistemas internos.

Como exemplo específico de uso, o Google cita a aplicação do Enterprise Search para o trabalho de analistas em bancos de investimento. Ao formular uma estratégia de investimento, é necessário pesquisar para avaliar um determinado mercado. Se houver uma aplicação que utilize o Enterprise Search em tal situação, você pode obter respostas claramente resumidas com base em todos os conjuntos de dados internos e externos simplesmente fazendo perguntas como “Qual é o evento mais impactante neste mercado?” e “Qual é a causa disso?”. As respostas incluem resumos e pontos importantes, permitindo que você compreenda o mercado instantaneamente. A pesquisa, que costumava levar vários dias, agora pode ser feita de forma rápida e precisa.

Claro, além de tais pesquisas, o Enterprise Search pode ser aplicado a sistemas internos em várias indústrias, desde finanças até mídia e saúde.

 

Duas funções adicionadas ao Vertex AI

O Google não fornece apenas o Generative AI App Builder como um serviço de IA e aprendizado de máquina. Por exemplo, existe o Vertex AI, uma plataforma que integra ferramentas relacionadas ao aprendizado de máquina. Duas novas funções foram adicionadas a este Vertex AI.

A primeira é a “Model Garden”. Esta é uma função que permite descobrir, pesquisar e operar o modelo apropriado a partir de vários modelos de aprendizado de máquina em um único ambiente. Os modelos em questão incluem centenas de modelos de terceiros e de código aberto. Ao utilizá-lo, você poderá usar os recursos mais adequados para suas necessidades de negócios de forma ainda mais suave.

O segundo é o “Generative AI Studio”. Esta é uma função para ajustar e implantar facilmente modelos de base. Especificamente, ele tem funções como ajuste de interface de chat e prompt. Embora seja fácil obter a resposta desejada com um prompt simples, pode ser difícil obter a resposta apropriada para comandos complexos. Ao usar o Generative AI Studio, você pode ajustar os parâmetros do modelo e melhorar a qualidade das respostas para perguntas complexas.

 

Produtos concorrentes da AWS, Azure e IBM

Não é apenas o Google Cloud que está anunciando ferramentas de desenvolvimento de IA gerativas. Aqui, apresentaremos serviços semelhantes ao Generative AI App Builder na AWS, Azure e IBM.

 

AWS ‘Amazon Bedrock’ 

Na AWS, a ferramenta de desenvolvimento de IA gerativa ‘Amazon Bedrock’ é fornecida. A Amazon Bedrock oferece quatro modelos básicos para construir facilmente aplicativos de IA generativa.

Especificamente, eles oferecem o ‘Jurassic-2’, que é conhecido por sua alta qualidade, flexibilidade e alto desempenho, o ‘Claude’, que realiza conversas, perguntas e respostas, automação de fluxo de trabalho, o ‘Stable Diffusion’, que gera imagens, arte, logotipos, designs, e o ‘Titan FMs’ que realiza geração de texto e resumos fornecidos pela AWS.

Além disso, é possível personalizar o modelo usando os dados da empresa. Você pode escolher o melhor entre vários modelos básicos e desenvolver aplicativos de IA generativa de forma rápida.

Azure ‘Azure OpenAI Service’ 

Na Azure, a ferramenta ‘Azure OpenAI Service’ foi anunciada. É um serviço nascido da co-desenvolvimento da OpenAI, que desenvolveu o ChatGPT, e a Microsoft.

A característica do Azure OpenAI Service é que você pode desenvolver aplicativos usando o ChatGPT. Especificamente, você pode usar quatro modelos que podem entender e gerar linguagem natural ‘GPT-3’, ‘GPT-4’, que tem uma gama mais ampla de conhecimento e habilidades de resolução de problemas do que o GPT-3 e também suporta análise de imagem, ‘Codex’, que gera código de programa a partir de linguagem natural, e ‘modelos de incorporação’ que podem ser usados para incorporação em aprendizado de máquina.

Ao usar o Azure OpenAI Service, mesmo aqueles sem conhecimento de IA, ciência de dados ou aprendizado de máquina podem facilmente incorporar modelos de IA em aplicativos.

IBM ‘Watsonx.ai’ 

Na IBM, a ferramenta ‘Watsonx.ai’ é fornecida. É uma plataforma para construir aplicações de IA que integra novas funcionalidades de IA gerativas que utilizam modelos base e o aprendizado de máquina tradicional.

Vários modelos de código aberto e treinados pela IBM estão disponíveis como modelos base, e você pode escolher de acordo com suas necessidades. Além disso, o Watsonx.ai tem todas as ferramentas necessárias para treinar, validar, ajustar e implantar modelos de IA em um só lugar.

Exemplos concretos de uso do Watsonx.ai incluem a elaboração de rascunhos de descrições de trabalho, a classificação de reclamações de clientes, o resumo de documentos regulatórios complexos e a extração de informações comerciais importantes.

Resumo 

Até agora, apresentamos várias funções relacionadas à IA, incluindo o ‘Generative AI App Builder’, que permite desenvolver facilmente a IA gerativa. Hoje em dia, o uso da IA é indispensável para o crescimento das empresas. Por favor, use este artigo para inovação e eficiência de trabalho em sua empresa.

 

Categories
Uncategorized

Resumo dos serviços de IA Generativa pelo Google Cloud

Resumo dos serviços de IA Generativa pelo Google Cloud.

Olá, somos o time de comunicação da Cloud Ace Brasil. Sejam todos bem-vindos a nossa página de blogs !

A inteligência artificial generativa já é uma realidade consolidada e continua moldando o futuro da tecnologia. No Google Cloud, destacamos nossa liderança nesse avanço com uma gama de serviços avançados, incluindo soluções de diálogo por IA e capacidades inovadoras de geração de código🤖.

Este artigo apresenta as funções e características dos serviços de IA generativa oferecidos pelo Google Cloud.

Índice

1. Serviços para desenvolvedores

2. Serviços para usuários de negócios

3. Conclusão

Recursos para Desenvolvedores

Vamos começar olhando para os produtos de IA generativa que podem ser usados por desenvolvedores de IA, desenvolvedores e cientistas de dados.

Generative AI Studio 

Generative AI Studio é um dos serviços da “Vertex AI” (plataforma de ferramentas para construir cargas de trabalho de machine learning no Google Cloud) e permite que você use o modelo de base do Google, o PaLM2, e outros modelos como Imagen e Chirp, que serão apresentados mais tarde, como APIs e ajuste e implante esses modelos. O Generative AI Studio possui recursos como uma interface de chat, design e ajuste de prompts e a capacidade de ajustar os pesos do modelo.

Além disso, você pode implementar diretamente modelos recém-ajustados em aplicativos ou implantar modelos em ambientes de produção. Isso pode reduzir significativamente o tempo necessário para implantar aplicativos em ambientes de produção.

Com os pontos de extremidade gerenciados da Vertex AI, você pode construir funções gerativas em aplicativos com algumas linhas de código, e os modelos de base implantados podem ser escalonados em ambientes de produção usando os recursos do MLOps da Vertex AI totalmente gerenciada.

Model Garden

Model Garden é uma ferramenta de catálogo que permite pesquisar, detectar e manipular vários modelos de aprendizado de máquina pré-construídos em um único local. Isso pode simplificar o processo de construção e implantação de modelos de aprendizado de máquina.

Os tipos de modelos suportados incluem “modelos de primeira parte” que podem usar modelos fornecidos pelo Google Cloud através de APIs, “modelos de código aberto” que podem usar vários modelos de código aberto prontos para empresas, e “modelos de terceiros”.

No Model Garden, você pode usar modelos diretamente, ajustá-los no Generative AI Studio, implantá-los em notebooks de ciência de dados e executar vários fluxos de trabalho. O Model Garden pode ser útil para encontrar facilmente modelos que atendam às suas necessidades ou para expandir suas ideias quando a tarefa necessária é vaga.

Vertex AI Codey APIs

Vertex AI Codey APIs é um modelo de base que gera código a partir de texto.

Em particular, ele tem a função de “geração de código” que gera código com base no prompt de linguagem natural que o desenvolvedor inseriu, “completar código” que sugere as próximas linhas com base no contexto do código inserido no prompt, e “chat de código” que permite que você faça perguntas relacionadas ao código em um formato de conversa, como depuração, criação de documentos e aprendizado de novos conceitos.

O modelo de geração de código suporta mais de 20 línguas, incluindo Go, Google Standard SQL, Java, Javascript, Python e Typescript. Usar esse recurso pode levar a melhorias na eficiência do trabalho e a eliminação do gap de habilidades entre os engenheiros.

Enterprise Search 

O Google Cloud oferecia o Enterprise Search como um serviço de construção de sistemas de pesquisa para empresas, mas agora é possível fazer pesquisas de diálogo porque foi incorporado ao ambiente de desenvolvimento de aplicativos de IA do Google Cloud, o “Generative AI App Builder”. Você pode pensar nisso como um ChatGPT para empresas. É uma função de pesquisa de diálogo que pode ser utilizada em sistemas de TI para clientes e funcionários.

Com esta função, você pode pesquisar instantaneamente informações necessárias a partir de vários tipos de dados acumulados dentro da empresa, como texto, imagens, vídeos, números e áudio. Os resultados da pesquisa não são mecânicos, mas são retornados de uma forma fácil de entender, com base na compreensão da intenção do usuário a partir do texto da consulta. Além disso, é possível extrair automaticamente informações particularmente importantes dos dados e obter resultados personalizados.

O conteúdo e os resultados da pesquisa do Enterprise Search não são usados para treinamento ou aprendizado do modelo, por isso você pode introduzi-los com confiança.

Conversation AI 

Conversation AI é uma função oferecida no “Generative AI App Builder”, assim como o Enterprise Search.

Até agora, os chatbots predominantes eram aqueles que retornavam respostas ou padrões de resposta previamente registrados de acordo com o conteúdo da pergunta de uma maneira mecânica, mas com o Conversation AI, o LLM pode gerar respostas para perguntas e consultas em linguagem natural.

Ao utilizar isso em tarefas de atendimento ao cliente, por exemplo, é possível fornecer respostas mais naturais e adequadas às intenções de maneira suave, o que se acredita melhorar drasticamente o valor da experiência do usuário.

Serviços para usuários de negócios 

Finalmente, explicaremos os produtos relacionados à IA que podem ser utilizados de forma ampla e conveniente pelos usuários de negócios, independentemente do setor ou ocupação.

Duet AI for Google Cloud 

Duet AI for Google Cloud é uma função de suporte ao desenvolvimento baseado em IA.

As funções do Duet AI for Google Cloud são principalmente três. A primeira é “Assistência de Código”, que é uma função principalmente para desenvolvedores de aplicativos e engenheiros de dados, onde a IA oferece suporte à entrada de código. A segunda é “Assistência de Chat”, onde você pode obter respostas para perguntas relacionadas ao desenvolvimento de aplicativos e à nuvem em formato de conversação. A terceira é “Duet AI for AppSheet”, onde você pode construir um aplicativo sem codificação apenas dizendo a funcionalidade necessária no chat.

Assim, Duet AI for Google Cloud pode ser considerado um serviço que oferece o suporte necessário para pessoas de todos os níveis, desde engenheiros qualificados até não engenheiros.

Imagen 

Imagen é um serviço que gera imagens a partir do texto que você inseriu. Por exemplo, mesmo para um texto absurdo como “A dragon fruit wearing a karate belt in the snow.” (Um pitaya usando um cinto de caratê na neve), ele gera automaticamente uma imagem de alta precisão.

*Referências https://imagen.research.google/

Esta função pode ser particularmente útil para auxiliar na criação de designs para marketing de conteúdo que precisa entregar uma grande quantidade de conteúdo de forma oportuna, ou para anúncios na web, logotipos, pôsteres, etc.

Contact Center AI

Contact Center AI é uma função onde a IA lida com o atendimento ao cliente como um humano. Ao introduzir o Contact Center AI no atendimento ao cliente, o agente virtual responderá às perguntas em seu lugar por voz ou texto.

Ao usar isso, você pode resolver problemas como “O tempo de espera para conectar ao operador é longo” e “Não consigo me conectar facilmente”, reduzindo custos. Além disso, deixando as perguntas simples para a IA, a equipe humana poderá se concentrar mais em lidar com problemas complexos.

Discovery AI 

Discovery AI é um produto que pode fornecer funções de pesquisa, navegação e recomendação de qualidade Google para seus ativos digitais.

Isso pode ser particularmente útil no e-commerce. Por exemplo, você pode exibir resultados apropriados com base na intenção de pesquisa, pesquisar facilmente produtos a partir de imagens, fornecer informações sobre itens semelhantes ou complementares no catálogo de produtos em tempo real, e implementar funções de recomendação mais precisas.

Ao utilizar o Discovery AI para fornecer uma experiência de compras online confortável, você pode evitar abandonos no meio do caminho, melhorar as conversões e aumentar o valor do pedido.

Duet AI for Workspace

Duet AI for Workspace é um termo geral para funções de AI que podem ser usadas no Workspace, que oferece vários serviços, como edição de documentos, planilhas e ferramentas de conferência online. Existem principalmente três tipos de funções oferecidas pelo Duet AI for Workspace.

O primeiro é “Help me write”. Esta é uma função que gera automaticamente um e-mail apropriado ou um documento quando você insere um pequeno texto. Pode ser usado no Gmail ou no Google Documentos. Por exemplo, se você inserir “ask for a full refund for this canceled flight” (solicitar reembolso total para este voo cancelado) no corpo do e-mail do Gmail, ele gerará automaticamente todo o texto que segue.

O segundo é “Help me Visualize”. Esta é uma função que pode ser usada no Google Slides, onde você insere várias palavras relacionadas à imagem necessária e a imagem é gerada automaticamente. As imagens geradas são naturais, considerando o sujeito, a configuração, a distância do sujeito e o fundo. Além disso, você pode ajustar a imagem gerada através do feedback.

O terceiro é “Help me Organize”. Esta é uma função para o Google Slide , onde você insere um resumo dos dados da tabela necessários e ele cria automaticamente um template correspondente. Por exemplo, se você inserir “Client and pet roster for dog walking business with rates” (Lista de clientes e animais de estimação para negócios de passeio de cães com taxas), ele gerará automaticamente uma tabela clara com os itens necessários instantaneamente.

Ao utilizar essas funções de IA, você poderá processar suas tarefas diárias de forma mais eficiente.

Chirp (Speech-to-Text) 

Chirp é o próximo modelo de Speech-to-Text (função de reconhecimento automático de fala) anunciado pelo Google em maio de 2023. Ele se concentra especialmente no fortalecimento do engajamento do cliente, permitindo uma comunicação mais profunda na língua materna do cliente através de legendas e assistência de voz.

Chirp suporta mais de 100 idiomas e continua adicionando idiomas e dialetos. A precisão do reconhecimento de voz também é alta, com 98% de precisão em inglês, e em idiomas com menos de 10 milhões de falantes, houve uma melhoria de até 300% em relação ao modelo anterior.

*Referência https://cloud.google.com/generative-ai-studio?hl=ja

Conclusão 

Até agora, apresentamos os produtos de IA generativa oferecidos pelo Google Cloud. Os serviços relacionados à IA generativa estão evoluindo rapidamente, com novas funções sendo anunciadas diariamente. Use este artigo como referência, aproveite os serviços de IA generativa do Google Cloud e conecte-os à eficiência dos negócios e à criação de novos negócios.