Módulo 3.1: OASIS - O Motor de Simulação Social

O que é:

OASIS (Open Agent Social Interaction Simulations) é um framework open-source para simulação de dinâmicas sociais usando agentes LLM. Desenvolvido como parte do ecossistema CAMEL-AI e documentado no paper arXiv:2411.11581, o OASIS cria ambientes de mídia social completos onde agentes autônomos publicam, comentam, seguem e interagem. Diferente de simulações baseadas em agentes tradicionais (ABM) que usam regras fixas, o OASIS delega decisões ao LLM, permitindo comportamentos emergentes mais ricos e imprevisíveis. A arquitetura separa o Environment Server (que mantém o estado do mundo) dos Agent Workers (que processam decisões individuais), permitindo escalonamento horizontal.

Por que aprender:

O OASIS é a fundação sobre a qual o MiroFish constrói suas simulações sociais. Compreender sua arquitetura é essencial para customizar simulações, diagnosticar comportamentos inesperados e interpretar resultados corretamente. Ele representa o estado da arte em simulação social com LLMs.

Conceitos-chave:

CAMEL-AI: plataforma multi-agente que provê primitivas de comunicação, memória e tool use
Environment Server: serviço centralizado que mantém estado global (posts, relações, feeds)
Agent Workers: processos distribuídos que executam decisões de cada agente via LLM
Action Loop: ciclo observe → reason → act executado a cada round da simulação
Paper arXiv:2411.11581: fundamentação teórica com validação experimental

O que é:

O OASIS alcança a escala de 1 milhão de agentes através de três inovações arquiteturais: (1) Paralelização massiva de chamadas LLM usando async workers com rate limiting inteligente que respeita limites de API sem desperdiçar throughput. (2) Batching de decisões onde múltiplos agentes similares têm suas decisões processadas em uma única chamada LLM com few-shot examples. (3) Group subscriptions que reduzem a complexidade de comunicação de O(n²) para O(n·k), onde k é o número de grupos, usando broadcast dentro de clusters de agentes com interesses similares em vez de comunicação ponto-a-ponto.

Por que aprender:

Fenômenos emergentes dependem de escala. Polarização, cascatas de informação e formação de bolhas só se manifestam de forma realista com populações grandes. Entender como o OASIS escala permite projetar simulações que capturam esses fenômenos macro sem explodir custos de API.

Conceitos-chave:

Async workers com semáforo: até N chamadas LLM simultâneas configuráveis
Decision batching: 10-50 agentes decidem por batch, reduzindo chamadas em 10-50x
Group subscriptions: agentes agrupados por cluster de interesses
Fidelity vs scale trade-off: agentes em batch perdem nuance individual
Cost estimation: ~$0.01 por agente por round com GPT-4o-mini

O que é:

O OASIS define um espaço de ações discretas que modela o comportamento em redes sociais reais. As 23 ações cobrem quatro categorias: Conteúdo (create_post, reply, repost, quote_post, edit_post, delete_post), Social (follow, unfollow, mute, unmute, block, unblock), Engajamento (like, unlike, bookmark, unbookmark, search, view_trend, view_profile), e Passivas (scroll_feed, refresh, do_nothing, log_off). Cada agente escolhe uma ação por round com base em seu feed atual, persona e memória. O LLM recebe a lista de ações válidas e retorna sua escolha com parâmetros.

Por que aprender:

O espaço de ações é a interface entre cognição e comportamento. Cada ação tem consequências diferentes na propagação de informação: um repost amplifica exponencialmente, um mute cria bolha de filtro, um do_nothing modela inatividade real. Configurar quais ações estão disponíveis muda drasticamente a dinâmica da simulação.

Conceitos-chave:

Action space: conjunto de ações válidas, configurável por simulação
Action parameters: cada ação aceita parâmetros específicos (ex: reply precisa de post_id e content)
Action probability: influenciada por personality traits e contexto do feed
do_nothing: ação essencial que modela inatividade e previne hiperatividade artificial
Action validation: Environment Server valida se a ação é legal no estado atual

O que é:

O OASIS implementa dois ambientes de plataforma social: TwitterEnv (baseado em timeline cronológica com modelo follow/follower, retweets e trending topics) e RedditEnv (baseado em subreddits com upvote/downvote, threading aninhado e múltiplos rankings: hot, new, top, controversial). Os agentes podem participar de ambas plataformas simultaneamente, com comportamento adaptado ao contexto de cada uma - por exemplo, posts mais longos e argumentativos no Reddit, mais curtos e virais no Twitter.

Por que aprender:

Fenômenos de migração cross-platform são cruciais em desinformação e formação de opinião. Conteúdo nasce em uma plataforma e viraliza em outra. A simulação dual-platform captura essa dinâmica que simulações single-platform ignoram completamente.

Conceitos-chave:

TwitterEnv: follow graph, retweet cascade, chronological + algorithmic feed
RedditEnv: subreddit hierarchy, vote-based ranking, threaded discussion
Cross-platform agents: mesma persona, comportamento adaptado ao contexto
Content migration: mecanismo de cross-posting entre plataformas
Platform-specific metrics: impressions (Twitter) vs karma (Reddit)

O que é:

Cada plataforma simulada implementa seu próprio sistema de recomendação que determina o feed de cada agente. O TwitterEnv combina timeline cronológica dos seguidores com um ranking baseado em cosine similarity entre os interesses declarados do agente e o conteúdo dos posts. O RedditEnv implementa o hot score do Reddit real: score = log10(max(|ups - downs|, 1)) + sign(ups - downs) × epoch_seconds / 45000. Ambos incluem um feed_size_limit que controla quantos posts o agente "vê" por round, simulando atenção limitada.

Por que aprender:

O sistema de recomendação é o fator mais determinante na formação de bolhas de informação. Alterar a fórmula de ranking (ex: aumentar peso de recência vs engagement) muda completamente quais fenômenos emergem. É a variável experimental mais poderosa do OASIS.

Conceitos-chave:

Hot score formula: combina magnitude de votos com decaimento temporal
Interest matching: cosine similarity entre embedding do perfil e do post
Feed size limit: atenção simulada, tipicamente 10-50 posts por round
Echo chamber effect: recomendações reforçam preferências existentes
Configuração experimental: variar algoritmo para medir impacto em polarização

O que é:

O paper arXiv:2411.11581 apresenta validação experimental rigorosa mostrando que o OASIS reproduz três fenômenos sociológicos fundamentais: (1) Cascatas de informação que seguem distribuição power-law, compatível com dados reais do Twitter - poucos posts viralizam, a maioria morre rapidamente. (2) Polarização de grupo onde opiniões intra-grupo convergem e inter-grupo divergem, medida via distância de opinião em escala Likert. (3) Efeito manada (herd behavior) onde agentes LLM demonstram conformidade social mais intensa que humanos reais - um achado crucial que sugere que LLMs treinados com RLHF têm viés inerente de conformidade.

Por que aprender:

A validação empírica é o que diferencia simulação de especulação. Saber que cascatas power-law são reproduzidas com fidelidade dá confiança nesse aspecto. Saber que herd behavior é amplificado alerta para cautela na interpretação de consensos simulados. Esta calibração é essencial para uso responsável.

Conceitos-chave:

Power-law distribution: P(cascade_size = k) ~ k^(-α), com α ≈ 2.1 compatível com dados reais
Group polarization index: divergência inter-grupo / convergência intra-grupo
Herd behavior ratio: taxa de conformidade dos agentes vs baseline humano
RLHF conformity bias: treinamento com feedback humano favorece respostas "socialmente aceitáveis"
Limitação reconhecida: agentes LLM não modelam irracionalidade emocional humana

⚡ OASIS: O Motor de Simulação Social