Machine Learning e Inteligência Artificial são tão bons quanto os dados que eles aprendem.

As capacidades da Inteligência Artificial precisam de uma dedicação maior de tempo, estratégia e alocação de recursos para evitar um estilo de operação "entra lixo, sai lixo".

“Machine Learning” e inteligência artificial (AI) podem ser classificados com segurança como os termos de 2017. Todos, desde consultores de negócios até a mídia, estão falando sobre eles e não é de admirar por que. Essas capacidades prometem encontrar respostas inovadoras em meio ao caos da Revolução Científica, onde a promessa de transformação digital é sobrecarregada por sistemas de tecnologia legados, enormes quantidades de dados e inovações emergentes que não atingem o local. A aprendizagem automática de máquinas e a AI são tão poderosas quanto a experiência e o conteúdo por trás delas. Afinal, para que uma máquina aprenda, precisa ser treinada. E este treinamento exige dados limpos e organizados e especialistas que sabem como os dados e a tecnologia funcionam.

 

Uma necessidade de organização, estrutura

Ensinar uma máquina a aprender exige alimentá-la de forma organizada e estruturada. Usar uma abordagem sistemática é essencial para medir se a potência é suficientemente forte para ser usada. Em última análise, o sucesso da capacidade de aprendizagem de máquinas está diretamente ligado ao treinamento de dados que lhe foi dado desde o início. Se fizer errado, você tem uma situação que "se entra lixo, sai lixo". Mesmo o recurso mais inteligente não pode processar uma massa aleatória de cadeias de texto não verificadas e tabelas de log para dar uma resposta significativa. Ou pior ainda, as capacidades realmente processam esses dados sujos e fornecem as respostas erradas.

Os cientistas de dados gastam a maior parte do tempo tentando limpar conjuntos de dados diferentes para treinar máquinas para fornecer as respostas que seus parceiros de negócio desesperadamente precisam. Surpreendentemente, porém, é comum esquecer que o mundo real é muito mais confuso do que o laboratório de ciência dos dados. Houve muitos casos de pessoas que adotaram conjuntos de dados históricos, passando muito tempo limpando-os - superando-os para provar exatamente o que eles estão procurando -, mas nunca treinando as máquinas adequadamente para refletir condições externas. Voltar aos resultados de testes como este, de modo que eles parecem promissores, de certa forma, é um tipo de epidemia na indústria, mas também é um produto de não ter o conhecimento da matéria adequada no laboratório.

 

Machine Learning e AI são tão bons quanto os dados que eles aprendem.

 

Investir no lugar errado

Treinar máquinas para entender as condições externas críticas e as influências que afetam seus modelos, quando colocados em prática, é essencial para seu sucesso. Digamos, por exemplo, que um cientista de dados está tentando treinar um sistema para entender o significado de um artigo de notícias apenas com base em seu título. No entanto, se eles alimentam dados do Twitter - uma plataforma de mídia social que não tem manchetes - todo o processo não funcionará. Também pode confundir propagandas como artigos, ou mesmo misturar idiomas se essas diferenciações não forem especificadas no treinamento. O aprendizado da máquina deve ser suficientemente robusto para lidar com os caprichos do mundo real e com diferentes especificidades de domínio, que se refletem nas diferentes classes de dados.

A maioria dos casos de negócios de aprendizado de máquinas falha porque eles investem nas ferramentas de tecnologia, mas não na experiência em gerenciamento de dados. O machine learning e AI são tão bons quanto os dados que eles aprendem, e isso requer especialistas que possam treinar sistemas desde o início; indivíduos que podem encontrar as respostas conectando os dados certos aos modelos certos.

As soluções de tecnologia que são necessárias para o sucesso de qualquer empresa são aquelas que tornam os dados digeríveis, não esmagadores. À medida que toda empresa passa por sua transformação digital, o que eles precisam é menos frivolidade e mais praticidade. A prática significa dados limpos e estruturados gerenciados por especialistas confiáveis. Afinal, machine learning e AI são tão atraentes quanto dados limpos e os conhecimentos que as treinam.

 

Artigo Original