# Apresentação
"**Large Language Model (LLM)** é um tipo especializado de inteligência artificial (IA) treinado em grandes quantidades de texto para compreender o conteúdo existente e gerar conteúdo original."
Large Language Models (LLMs)
Gartner
[Link](https://www.gartner.com/en/information-technology/glossary/large-language-models-llm)
---
**O que são Large Language Model (LLM)?**
Um **Large Language Model (LLM)** é um tipo de algoritmo de inteligência artificial ( IA ) que usa técnicas de aprendizagem profunda e conjuntos de dados extremamente grandes para compreender, resumir, gerar e prever novos conteúdos. O termo IA generativa também está intimamente ligado aos LLMs, que são, na verdade, um tipo de IA generativa que foi especificamente arquitetada para ajudar a gerar conteúdo baseado em texto.
Um LLM é a evolução do conceito de modelo de linguagem em IA que expande drasticamente os dados usados para treinamento e inferência. Por sua vez, proporciona um aumento maciço nas capacidades do modelo de IA. Embora não exista um número universalmente aceito sobre o tamanho que o conjunto de dados para treinamento precisa ter, um LLM normalmente tem pelo menos um bilhão ou mais de parâmetros. Parâmetros é um termo de aprendizado de máquina para as variáveis presentes no modelo no qual foi treinado e que podem ser utilizadas para inferir novos conteúdos.
**Para que são usados os grandes modelos de linguagem?**
Os LLMs tornaram-se cada vez mais populares porque têm ampla aplicabilidade para uma variedade de tarefas de PNL, incluindo as seguintes:
- **Geração de texto.** A capacidade de gerar texto sobre qualquer tópico no qual o LLM tenha sido treinado é um caso de uso principal.
- **Tradução.** Para LLMs treinados em vários idiomas, a capacidade de traduzir de um idioma para outro é uma característica comum.
- **Resumo do conteúdo.** Resumir blocos ou múltiplas páginas de texto é uma função útil dos LLMs.
- **Reescrevendo conteúdo.** Reescrever uma seção de texto é outra capacidade.
- **Classificação e categorização.** Um LLM é capaz de classificar e categorizar conteúdo.
- **Análise de sentimentos.** A maioria dos LLMs pode ser usada para análise de sentimento para ajudar os usuários a compreender melhor a intenção de um conteúdo ou de uma resposta específica.
- **IA conversacional e chatbots.** Os LLMs podem permitir uma conversa com um usuário de uma forma que normalmente é mais natural do que as gerações anteriores de tecnologias de IA.
O que são Large Language Model (LLM)?
TechTarget
[Link](https://www.techtarget.com/whatis/definition/large-language-model-LLM)
> [!NOTE] ChatGPT
O chatbot de IA baseado em LLM mais usado é o [[ChatGPT]], desenvolvido pela OpenAI.
# Referências Importantes
How Large Language Models work
From zero to ChatGPT
Andreas Stöffelbauer
Microsoft
[Link](https://medium.com/data-science-at-microsoft/how-large-language-models-work-91c362f5b78f)
# Trilha
[[Inteligência Artificial]]
[[ChatGPT]]