#23 Criação de Insights em Organizações Centradas em Dados

Subscribe to get the latest

on Tue Sep 29 2020 17:00:00 GMT-0700 (Pacific Daylight Time)

with Darren W Pulsipher, Sarah Kalicin,

No artigo 5 de uma série, Iniciando sua Transformação Organizacional para se Tornar Orientada a Dados, Sarah Kalicin, Cientista de Dados Líder, Intel, e Darren Pulsipher, Arquiteto Chefe de Soluções, Setor Público, Intel, discutem como criar insights usando IA e aprendizado de máquina em uma organização orientada a dados.


Keywords

#aiml #dataarchitecture #datacentric #data #insight #technology


Usando o exemplo da fabricação de widgets, Darren e Sarah anteriormente falaram sobre o pipeline de dados na tentativa de responder a uma pergunta fundamental do negócio: Quantos widgets produzir. A complexidade torna-se aparente quando se trata de pegar os dados brutos da demanda do cliente, da oferta atual e da perda de rendimento e convertê-los em insights.

O primeiro passo neste processo, antes de você poder decidir quais ferramentas usar, é preparar os dados em uma forma utilizável. Oitenta ou noventa por cento do trabalho de um cientista de dados está em preparar e transformar os dados para que possam ser inseridos em um algoritmo, por exemplo, ou usados para reconhecimento de padrões.

As ferramentas corretas são complexas. IA e aprendizado de máquina não utilizam um único algoritmo, mas uma infinidade de ferramentas que cientistas de dados utilizam e experimentam em combinações para obter os melhores resultados de insights. Em outras palavras, um único algoritmo não dirá quantos widgets você deve fabricar. Existem muitas partes sobrepostas e as próprias ferramentas são complexas. Além disso, os cientistas de dados têm áreas de especialização diferentes; a ciência de dados é um esporte em equipe. Assim como você não designaria um engenheiro de rede para criar arquitetura de armazenamento, você não contrataria um engenheiro de aprendizado profundo especializado em reconhecimento de imagem para resolver o problema de análise de rendimento. Você precisa contratar os cientistas de dados corretos para projetar e implantar as ferramentas corretas para obter insights sobre suas questões de negócios.

Vamos voltar à questão de quantos widgets você deve fabricar. Cada situação e modelo serão diferentes, é claro, considerando o tipo de perguntas, dados e dinâmicas que você possui, mas vamos usar isso como ponto de partida. Uma vez estabelecida essa questão de negócio, a organização passará por um desenvolvimento de maturidade analítica.

Primeiro, você vai se concentrar no que aconteceu no passado para identificar padrões na demanda por seus widgets. Por exemplo, você pode analisar dados de séries temporais para ver quando a demanda por widgets aumenta e diminui. Quão estável é a informação ao longo do tempo e como você pode usá-la para prever o futuro? Talvez você possa fazer aprendizado de máquina em torno disso para analisar diferentes segmentos de tempo e compreendê-los. Você também pode querer fazer alguma análise de texto, como verificar se as pessoas estão falando sobre seu widget nas redes sociais. O número de curtidas ou compartilhamentos pode ser uma fonte de dados.

Você poderia fazer algo semelhante com o fornecimento. Quão estável é o fornecimento atual e quanto você entende das dinâmicas do sistema? Observe onde você precisa de um humano para entender as dinâmicas do sistema e incorpore esse conhecimento na maneira como você faz suas análises. Pode haver algum tipo de padrões de aprendizado de máquina que fornecem algumas ideias de insights, então você pode fazer algumas aprendizagem não supervisionada. Aprendizagem não supervisionada é encontrar se existem categorias ou segmentos diferentes dos quais você não está ciente e que se comportam de maneira diferente uns dos outros. Pergunte como você pode rastrear melhor ou obter uma melhor resolução do que está acontecendo nesses grupos.

Em resumo, dependendo de onde os dados estão vindo e o que você está analisando nesses dados, você vai utilizar ferramentas diferentes.

Perda de rendimento é um exemplo da complexidade dos problemas a serem solucionados. Quanto maior a variação na linha de produção, mais desperdício pode ocorrer. A aprendizagem de máquina, nesse caso, irá analisar segmentos e agrupamentos de diferentes tipos de rendimentos. Como quantificar e prever isso?

Uma coisa que cientistas de dados fazem aqui é o design de experimentos para tentar estimar a causalidade. Ao girar botões e puxar alavancas de maneira sistemática, é possível ver o que acontece com o rendimento, adicionando controles de processo para evitar desvio.

Outra oportunidade para realizar análises é a confiabilidade. Por exemplo, com a manutenção preditiva, suas ferramentas de manufatura podem ser mantidas de forma oportuna para evitar perdas de rendimento. Você também pode utilizar análise de texto em certas situações, como quando você tem registros escritos de observações e soluções feitas por técnicos ao longo do tempo, para utilizá-los como uma base de conhecimento coletivo.

A aprendizagem profunda em torno do reconhecimento de imagem é outra estratégia para ajudar a prevenir perdas por meio da detecção de erros e falhas, e talvez até mesmo a categorização de defeitos.

O objetivo de tudo isso é, é claro, obter conhecimento valioso para o seu negócio. A chave é o comprometimento com uma organização centrada em dados, mantendo-se flexível e contando com as ferramentas e as pessoas certas para transformar seus dados em insights acionáveis.

Podcast Transcript