fourmaislogo-05

Minha gestora e data science: uma jornada possível?

Desvendando novas possibilidades de análises: por que você deve explorar o potencial de data science em sua gestora de fundos de investimentos

As gestoras de fundos de investimentos estão descobrindo oportunidades para otimizar resultados a partir da integração de métodos de investimento quantitativos, novas tecnologias e data science. E o que caracteriza uma asset exponencial é justamente sua capacidade de gerar alfa.

O que essas empresas têm em comum? Elas investem na ciência de dados e a utilizam estrategicamente em suas operações. Ao adotarem abordagens sistemáticas, a estratégia norteadora dos processos de investimento – da criação de ideias, testes de hipóteses à gestão do risco –, é sustentada na construção de modelos com maior potencial de processamento de base em dados de fontes convencionais e não convencionais. Como reflexo, menos risco, mais transparência e eficiência na tomada de decisão.

Quando bem aplicados a motores de análise desenvolvidos com práticas de data science, os dados proporcionam análises mais estatísticas, contribuindo para uma visão holística do mercado, fornece insights para a tomada de decisões sobre os investimentos e amplia formatos de teses de hipóteses e modelos. Assim, é necessário utilizar dados de diversos instrumentos econômicos e classe de ativos, dados alternativos, para criar modelos analíticos que avaliam taxas de retorno de investimentos e riscos com precisão.

Dados alternativos implica ir além dos financeiros, como indicadores econômicos, preços de ativos e demonstrações financeiras, e incorporar dados de compras em sites de e-commerce, tráfego aéreo e marítimo, feeds das redes sociais e aspectos sociais, ambientais e de governança (ESG). Desse modo, é possível incluir análises de fatores que influenciam no mercado financeiro, como tendências políticas e sociais, bem como tendências comportamentais.

A capacidade de obter esses grandes volumes de dados de fontes variadas, tratá-los e analisá-los tornou-se uma vantagem competitiva frente ao contexto econômico atual. E isso não exclui gestoras de menor porte dessa transformação, que pode acontecer gradualmente à medida que se investe em tecnologias e pessoas.

Data science: agregando valor nas operações das gestoras

A ciência de dados está cada vez mais imersa nas operações de investimento das assets brasileiras. Embora as principais iniciativas estejam concentradas na etapa de pesquisa e geração de ideias para 80% dos respondentes, data science também desempenha um papel importante no gerenciamento de portfólio (62%), na avaliação de risco (47%) e nas atividades do trade (31%).

Ao implementar práticas de data science, as gestoras podem obter insights a partir do cruzamento e do maior volume de dados convencionais e alternativos para capitalizar novas oportunidades de investimento. Além disso, o uso de grande volume de dados possibilita análises mais precisas e, consequentemente, amplia a eficácia do gerenciamento dos riscos inerentes ao buy-side. 

De acordo com o estudo, as gestoras que já adotam ciência de dados reconhecem que poderiam fazer mais se tivessem uma equipe mais qualificada, mais tempo e experiência para identificar a tecnologia certa. Em essência, construir uma equipe multidisciplinar e colaborativa, com profissionais com conhecimento de finanças, estatística, comportamento e tecnologia é fundamental para extrair o máximo valor dos dados que serão utilizados para a construção dos modelos analíticos. 

Entre as empresas participantes do estudo que buscam aplicar a ciência de dados em suas operações, dois terços apontam que precisam investir em pessoas para gerenciar essa estratégia de dados. As principais ações necessárias pontuadas por elas são: melhorar a qualificação da equipe existente, contratar mais pessoas e trazer consultores externos.

Quais os reais desafios na adoção de data science?

Conforme pesquisa, a questão orçamentária aparece entre o quarto desafio mais citado pelas gestoras brasileiras quando o assunto é aumentar o papel da ciência de dados em suas operações.

Para avançar na jornada data-driven e tornar os dados acionáveis, essas organizações precisam montar uma estrutura de tecnologia que viabilize coleta, limpeza, processamento e visualização dos dados, além da criação de aplicações para análise das informações. 

Outro passo importante é a aquisição de dados de confiança e a qualidade dos mesmos. Os dados convencionais já são lugar-comum para as gestoras, como indicadores econômicos, preços de ativos e demonstrações financeiras. Além disso, são fornecidos por plataformas e amplamente utilizados nos processos de investimento devido à sua confiabilidade e segurança. 

Ao adicionar dados históricos e real time, quando necessário, nas análises, como preços, feeds de notícias, redes sociais, consumo, dados de geolocalização e outros, as empresas devem buscar provedores e plataformas de dados confiáveis e justificáveis. A seleção dos provedores deve levar em conta aspectos como frequência dos dados, curadoria, formato de entrega, conectividades, estabilidade da ferramenta e meios de distribuição das informações. 

Além de escolher quais dados serão trabalhados, é preciso definir como serão armazenados (nuvem ou on-premise), o que exige um orçamento não apenas para aquisição, mas também para contratação de serviços de hospedagem, bem como de talentos especializados, como engenheiros e cientistas de dados.  

Outra preocupação é a segurança do ambiente que garante o fluxo operacional data-driven, de modo que é necessário criar regras de compliance relacionadas a como essas informações são armazenadas na nuvem e dentro de casa e como elas são acessadas para suportar os modelos de ideação, execução de operações, alocação nos fundos e portfólios, P&L, conciliação de contrapartes e outras funções. 

Implementar práticas de data science em análises financeiras, contudo, é um processo altamente complexo que envolve não apenas investimentos em tecnologia e talentos, mas também uma mudança cultural que deve ser apoiada pela liderança e visionar os primeiros resultados a médio prazo

O que é necessário para montar uma infraestrutura de data science?

Em um modelo de decisão data-driven para o acesso aos dados, a gestora deve criar um ecossistema robusto para o processamento e distribuição das informações de forma holística. Para implementar uma estrutura de gerenciamento de dados – da coleta, à análise e ao aprendizado de máquina –, uma esteira de tratamento de dados precisa ser construída para extração e limpeza dos dados, verificação de inconsistências, entrada no data lake, armazenagem e exibição aos usuários. 

O grande desafio é estruturar pipelines de dados robustos e automatizados para pôr em prática motores de análises. Além de definir critérios para seleção e tratamento dos dados adquiridos, a gestora deve decidir como esses feeds de dados serão construídos e armazenados e como esse fluxo de trabalho será gerenciado. Há inúmeras soluções disponíveis no mercado para essas funções, como gerenciadores de workflow/pipeline, infrastructure as code (IaC), nuvens e soluções distintas para dados estruturados e não estruturados. 

Pipeline de dados: quais tecnologias são necessárias? 

Da coleta à preparação de análise, cada etapa do ciclo de vida do dado tem um conjunto de tecnologias próprio.

Ingestão

Soluções de captura e unificação de dados de diversas fontes para armazenamento na nuvem e on-premise. 

Armazenamento de dados brutos

dados não processados ou dados em estado bruto referem-se a informações que são coletadas e armazenadas exatamente como são obtidas, sem terem passado por qualquer forma de transformação, limpeza ou organização significativa diretamente das fontes, como bancos de dados, registros de transações, dispositivos, mídia social e outras fontes de coleta de dados.

Processamento

O processamento de dados pode ser feito tanto em lote quanto em stream (de maneira contínua conforme a chegada de novos dados), a depender da tecnologia escolhida. 

Catálogo

Recurso tecnológico responsável pela organização, integração e movimentação de dados para o desenvolvimento de aplicações e modelos.

Acesso ao data lake

Repositório centralizado de dados estruturados e não estruturados, que podem ser de diversas fontes e formatos.

Modelos de machine learning

Tecnologias ajudam de execução de modelos de machine learning customizados.

Visualização, APIs e data warehouse

Aqui entram em cena as soluções que permitem explorar por meio de regras de catalogação, bem como a visualização de insights gerados a partir dos dados ingeridos, processados e analisados.

Análise de investimento

Uso de tecnologias de visualização de dados e modelos para gerar insights e contribuir com a tomada de decisão.

Além disso, a linguagem de programação Python está fortemente relacionada à ciência de dados, sendo hoje uma das mais populares do mundo. Python possibilita aos cientistas de dados criar modelos e classificadores que categorizem dados de modo preciso. De olho nisso, muitos analistas buscam aprender essa linguagem para avançar em suas análises e conquistar maior autonomia em relação à equipe de TI. 

Todos esses processos interferem diretamente na qualidade, na visualização dos dados e na forma como o modelo irá operar para garantir retornos, reduzir riscos e gerar alfa. Por isso a importância de contar com parceiros especializados que ofereçam as melhores plataformas e atuem consultivamente para se chegar aos melhores resultados. Esses parceiros devem sobretudo oferecer tecnologias escaláveis, oferecer suporte e acompanhamento de profissionais especializados, bem como soluções flexíveis e abertas para serem facilmente integradas, como soluções disponíveis em APIs, além de interfaces de simples gestão para utilização entre times multidisciplinares.

Conclusão: é uma jornada possível

A ciência de dados está traçando novos caminhos para gestoras na busca por gerar alfa. Esta habilidade de incorporar análise de maior volume de dados em processos de tomada de decisão ao redor de investimentos definirá quais empresas estão no caminho para se tornar uma asset exponencial. 

Uma cultura data science é possível quando se assume riscos, uma vez que será necessária uma curva de aprendizado, revisão de modelos e aquisição de novas habilidades para lidar com a complexidade tecnológica e analítica. Não há um guia definitivo para implementá-la, de modo que as gestoras devem unir abordagens quantitativas e discricionárias à medida que avançam na maturidade da ciência de dados.

Construir e manter uma imagem e reputação no mercado é uma jornada que deve ser avaliada constantemente, não importa o tamanho em funcionários ou AUM (asset under management). A expansão de práticas data driven pode ocorrer de forma gradual, de acordo com as prioridades de negócio e saber aonde quer chegar. 

Quer iniciar a jornada do uso de dados em sua gestora? As tecnologias de data science, quant e analytics foram projetadas para apoiar profissionais a gerenciar e analisar dados de forma exponencial. Fale com um especialista da Bloomberg.

Fonte: Bloomberg

Compartilhe

Facebook
Twitter
LinkedIn
Telegram
WhatsApp
Reddit

Recomendamos também