Kalshi: dados alternativos em economia e finanças


Olá, Reader, como foi o final de semana?

A edição 182 do Boletim AM está no ar!

Quando eu comecei nesse negócio lá em 2015, a profissão de Cientista de Dados ainda não era muito conhecida no Brasil.

Na verdade, o termo ciência de dados nem era muito usado.

Era tudo mato alto.

No mundo particular dos economistas e da análise de dados econômicos e financeiros, então, a coisa era feia.

Séries temporais regulares, com mais de 100 observações, era luxo.

Afinal, o país que começou a vencer a hiperinflação em 1994 só conseguiu ter séries econômicas e financeiras razoáveis a partir dos anos 2000.

Então, se você soubesse organizar seus dados no Excel, conseguisse rodar algumas dúzias de modelos em Eviews ou Stata e chegasse a alguma conclusão (quantitativa e não opinativa) minimamente decente a partir disso, já estava muito à frente do mercado.

Lembre-se que naqueles tempos, ainda havia um debate (meio tosco) na academia brasileira entre heterodoxos vs ortodoxos.

No Instituto de Economia - da Praia Vermelha, com passagem por Barão Geraldo - tinha um professor que, inclusive, duvidava do uso de dados em economia. Dizia, com uma boa dose de arrogância, que economia é um sistema dinâmico tão complicado que não pode ser compreendido usando estatística.

Dados e evidências eram coisas de engenheiro, não de economistas.

Pois é, Reader, tempos loucos.

10 anos depois, felizmente, os dados venceram.

E hoje em dia, estão até ensinando análise de dados nas faculdades, veja você - inclusive nessas casas mais avessas à evidência empírica.

Há, diga-se de passagem, uma corrida contra o tempo nas faculdades de economia para incorporar disciplinas como análise de dados, linguagens de programação, estatística e econometria aplicadas...

Tem um pessoal implementando até cursos de IA nas grades curriculares.

É tipo 7x1.

E dá até um certo orgulho de canto de boca quando olho para trás e vejo aqueles debates intermináveis com o pessoal heterodoxo.

Mas, Vítor, você pergunta, por que diabos está me contando tudo isso?

Estou te contando esse trem todo, como dizem meus amigos mineiros, para te falar sobre a próxima onda que vem por aí...

E não, não é IA.

A pandemia gerou uma ruptura muito forte na humanidade e antecipou diversas tendências.

Uma delas é que estamos utilizando cada vez mais dados alternativos.

Isto é, dados provenientes de satélites, de logística e comércio, transações e pagamentos, mobilidade e geolocalização, dados climáticos e ambientais, dados de sentimento e texto, dados imobiliários e urbanos, dados de web e digitalização...

Dados estruturados advindos de bancos de dados relacionais, onde linhas são observações e colunas são features, agora se juntam a dados semiestruturados (arquivos de logs, JSON, XML, etc) e dados não estruturados (emails, documentos, pdfs...) para gerar um ambiente extremamente rico e inovador.

Quer um exemplo?

Enquanto você estava pulando carnaval, o Federal Reserve - o BC norte-americano - publicou um paper sobre o uso de uma nova fonte de dados para averiguar expectativas de agentes: a plataforma Kalshi.

Kalshi é a primeira plataforma regulamentada pelo governo norte-americano onde os investidores apostam diretamente em resultados econômicos, como inflação, folha de pagamento e decisões do próprio FED.

Os resultados encontrados pelo paper sugerem que esses (novos) mercados (de alta frequência) produzem previsões de densidade bem calibradas e de atualizaçao rápida sobre importantes variáveis econômicas.

Inclusive, diga-se, sobre várias para as quais não existem medições confiáveis hoje em dia.

Trocando em miúdos...

Em outras palavras, Reader, existe um oceano azul de informações que ainda serão incorporadas para gerar previsões cada vez mais acuradas de dados econômicos e financeiros.

Mas para isso...

Você vai precisar sair da sua bolha de dados tabulares e séries temporais.

Esse trem partiu.

Rodar algumas dezenas de modelos já não diz muita coisa.

Nem mesmo 10.000 modelos.

Incorporar dados não convencionais ou alternativos na análise económica passa a ser o grande alvo de analistas e pesquisadores.

Porque, pensa comigo, o que é a essência de um dado econômico?

Um dado econômico é basicamente um sinal de mudança dentro do organismo de trocas.

Basicamente, quando construímos um dado econômico estamos medindo essas mudanças em preços e quantidades de trocas feitas dentro da sociedade.

Incorporar, portanto, novas formas de mensurar isso é mais do que bem-vindo.

É sentir o pulso da economia com maior riqueza de detalhes.

Construir esse arcabouço, porém, vai exigir do analista cada vez mais conhecimentos em lidar com dados não estruturados, com o uso de ferramentas de processamento de linguagem natural e análise de imagens, por exemplo.

Além disso, a ciência de dados escalou nos últimos anos, de modo que se antes a gente rodava alguns modelos nos nossos notebooks, hoje o que se faz é rodar milhares de modelos com milhares de features estruturadas e não estruturadas em produção, dentro de alguma nuvem.

A área de finanças e economia, naturalmente, vai passar por esse mesmo processo.

Então, se hoje, as instituições campeãs do Focus ainda estão na primeira fase do uso de ciência de dados, daqui a alguns anos, à medida que incorporem mais e mais engenharia de dados, vamos para a segunda fase.

Nesse momento, veremos previsão de inflação, por exemplo, em tempo real.

Não é algo distante.

Vejo muitas casas (grandes) se movendo para isso.

Vejo cada vez mais a adoção de soluções em modernas plataformas de Lakehouse, como Databricks, que possibilitam organizar pipelines de dados estruturados e não estruturados.

Soluções que envolvam deep learning serão cada vez mais incorporadas no dia a dia da profissão, à medida (claro) que esses tais dados estejam disponíveis.

E a evolução está acontecendo bem rápido.

Como você está se preparando por aí?

Era uma das perguntas que eu gostaria de fazer, viu, para aquele professor da Praia Vermelha...


Um abraço,
Vítor Wilher — Análise Macro
A verdade está nos dados

Perdeu alguma edição anterior do Boletim AM? Sem problemas. Leia as edições anteriores tocando aqui

Boletim AM

Receba todo domingo à noite em seu e-mail nossa newsletter com exercícios reais de análise de dados econômicos e financeiros, envolvendo muito estatística, econometria, machine learning e inteligência artificial em R e Python. Tudo o que você precisa saber para estar antenado no mundo dos dados!

Read more from Boletim AM

Edição #191 Newsletter Semanal da Análise Macro Um agente de IA para Reader Pensa numa semana típica do seu trabalho. Talvez você precise escrever um relatório macro em cima de três decks de apresentação do BC, dois e-mails do operador e quatro reports de research acumulados desde quarta. Talvez precise fechar um parecer contábil sobre seis balanços trimestrais e os releases de resultado que vieram junto. Talvez seja um material para o comitê de investimentos, uma nota para clientes, ou um...

Edição 190 - Boletim AM Newsletter Semanal da Análise Macro Claude Code, resfriado e o que mudou em 30 horas Fala, Reader, tudo certo por aí? Por aqui, peguei um resfriado brabo. Feriado e sábado de cama. Dormi quase 30 horas... Voltei meia boca hoje pela manhã. Enquanto minha esposa prepara o almoço, escrevo essas linhas para você. Não sem antes, abrir o VS Code e dar uma olhada nos projetos em aberto. Tenho hoje diversos projetos rodando em paralelo: Paper sobre uso de diferentes LLMs para...

Edição 189 - Boletim AM Newsletter Semanal da Análise Macro Qual o melhor LLM para ler o COPOM? Fala, Reader, bora pra mais uma semana? Aproveitei essa semana cheia de feriados para colocar um monte de coisa em dia - no pessoal e no profissional, como diria aquele famoso apresentador de TV. No pessoal, encontrei amigos que não via há alguns meses e coloquei o papo em dia. Sempre bom pausar a mente e estar com pessoas que a gente ama de verdade, não é mesmo? Maravilhoso. Já no profissional,...