Data Scientist: i 5 volti del mago dei Big Data

 

Per il mese di Settembre inauguro la rubrica “la risorsa del mese” con un libro tecnico molto interessante per chi, come me, è appassionato di tecnologia innovativa: Big Data @l Lavoro” del professore e ricercatore Thomas H. Davenport (Franco Angeli editore, 2015).

Risultati immagini per data scientist

Inserisci una didascalia

Big Data @l Lavoro è manuale utile per quei manager che vogliono portare una ventata d’innovazione alla loro azienda, introducendo l’utilizzo dei big data nelle loro strategie di business.

Attraverso una ricerca su un ampissimo ventaglio di aziende, Thomas H. Davenport ha descritto una panoramica, ricca di dettagli e di case history, di tutto ciò che riguarda il mondo dell’analytics dei dati, ipotizzando l’immediato avvento di un da lui nominato “Analytics 3.0“.

« Vi sono sempre stati tre tipi di analytics: descrittiva, che informa su ciò che è stato; predittiva, che usa modelli basati sui dati passati per prevedere il futuro; e prescrittiva, che usa modelli per stabilire i comportamenti e le azioni ottimali. L’Analytics 3.0 li comprende tutti e tre, ponendo però maggiore enfasi sull’analytics prescrittiva. (p. 180) »

Con un crescente interesse verso il lavoro delle HR nelle aziende che fanno dell’uso delle tecnologie innovative il loro core business, ho deciso di studiare i ruoli tecnici capaci di lavorare con questi complessi strumenti.

Lungi da me spiegare nei dettagli tutti il manuale, di cui vi consiglio caldamente la lettura, in questo articolo vorrei focalizzarmi sul ruolo professionale del data scientist, così come è emerso dalle ricerche di Davenport.

Secondo questi riscontri, infatti, il data scientist è una figura poliedrica dotata di numerose sfaccettature.

Ma andiamo con ordine: cosa fa il professionista che assolve il ruolo di data scientist?
Tenendo conto che i big data consistono in un’enorme mole di dati (talmente grande da dover rientrare in numerosi server) dotati di un flusso continuo (quindi che male si adattano  a dei data warehouse statici), i data scientist sono quelle figure professionali che elaborano ed interpretano i suddetti big data.

Essi non hanno una formazione univoca: sono pochi e molto recenti i corsi di laurea dedicati esclusivamente a produrre profili di data scientist. Spesso, questi soggetti non possiedono neppure una laurea, ma sono abituati a “smanettare” con i codici di programmazione e hanno la capacità di apprendere rapidamente ambienti di lavoro anche molto distanti dal proprio. Infatti, i reparti Risorse Umane (Human Resources o HR) ricorrono sempre meno al reclutamento universitario, affidandosi alle hackaton, competizioni tra gli hacker spesso volte a risolvere una problematica aziendale.

In particolare, Davenport descrive il data scientist come l’unione di più figure professionali in un’unica persona:
Hacker capace di scrivere in linguaggi di programmazione e di comprendere le architetture alla base dei big data;
– Scienziato che utilizza il metodo sperimentale per interpretare i propri risultati;
– Consulente in grado di comunicare sia con i colleghi che con i non addetti ai lavori;
– Analista quantitativo, un vero e proprio statistico in grado di lavorare sia su dati strutturati che su quelli non strutturati (come testi, video o immagini);
–  Esperto di business capace di influenzare il processo decisionale dell’azienda allo scopo di generare utili.

Analizziamo ciascuna di queste molteplici facce del data scientist, allo scopo di creare un profilo di candidato ideale.

L’hacker

L’anima del data scientist è quella di un hacker, poiché egli trova piacere nello “smanettare” con i codici informatici per raggiungere gli scopi più disparati. Questi codici non sono dei linguaggi semplici, e spesso sono in continuo aggiornamento e cadono in disuso nel giro di qualche anno. Per questo il data scientist deve avere una vera e propria “predisposizione” all’apprendimento di questi tool, poiché solo così sarà in grado di aggiornarsi velocemente ed essere competitivo rispetto ai colleghi di altre aziende.

Per i non addetti ai lavori, considerate il linguaggio di programmazione come una vera e propria lingua, come lo sono l’italiano, l’inglese e il cinese, con la sua grammatica interna, i suoi significati e i suoi diversi utilizzi. Come esistono persone particolarmente predisposte ad imparare una lingua straniera, dunque, esistono hacker più inclini di altri ad apprendere i linguaggi di programmazione.

Con un piccolo dettaglio: ad oggi i linguaggi di programmazione non si riescono a contare nella loro totalità, talmente è alto il loro numero, ed esperimenti irriverenti come quello di “99 Bottle of Beer” (un sito dove una stessa canzone, intitolata “99 bottiglie di birra”, viene riscritta dagli utenti in tutti i linguaggi di programmazione conosciuti) sono arrivati a contarne 1500.

Per cui, il data scientist deve avere un profilo cognitivo improntato all’apprendimento rapido, e non solo efficace. Questo genere di abilità non si presenta naturalmente alla nascita, ma si allena costantemente con anni di studi autonomi a scadenze molto ravvicinate.

L’obiettivo è, dunque, essere sempre aggiornati sui tool più recenti. E non solo: deve anche conoscere molto bene più di un ambito. Il motivo viene spiegato da Mark Grabb, senior data scientist per General Electric Global Research (citato da Devenport):

« In General Electric abbiamo constatato che i data scientist dotati di expertise in due o tre campi sono i più efficaci, e che sono tali per diverse ragioni. Anzitutto sembra che una più ampia preparazione offra un vantaggio decisivo in termini di creatività. Queste persone rappresentano la pietra angolare di un’organizzazione. […] Gli esperti di analytics specializzati in una sola area tendono a essere meno collaborativi con i colleghi, mentre un data scientist, per essere veramente valido, deve anche saper collaborare. […] Assumere solo specialisti significa quindi dover poi prevedere un’intensa attività di formazione. (p.97) »

Lo scienziato

Il data scientist deve inoltre utilizzare il rigore del metodo scientifico, effettuando dunque ipotesi e confutando le proprie idee sulla base dei fatti e non delle proprie sensazioni.

Deve inoltre essere in grado di improvvisare qualora le cose non prendano la direzione desiderata, per non mandare a monte il lavoro svolto, orientandosi in modo estremamente determinato verso l’azione: tutto ciò che viene fatto, deve cambiare qualcosa nell’ambiente circostante. Preferibilmente in meglio.

Tale orientamento all’azione non porta sempre vantaggi: l’impazienza, la “smania” di agire il prima possibile può

« […] indurre le aziende a commercializzare i loro prodotti e servizi quando ancora non sono maturi e presentano altrettanti difetti di quante sono le funzionalità. Nella Silicon Valley però questo è addirittura un vanto […]. I data scientist levano presto le tende se hanno l’impressione di non combinare gran che e che i progetti procedono a rilento. (p. 148) »

Il consulente

L’inesausta pragmaticità del data scientist spesso porta il professionista a isolarsi nei suoi modelli, impenetrabili dagli altri colleghi che rivestono ruoli diversi. L’estrema schematizzazione del tutto li porta ad abituarsi a processi di pensiero molto rigidi, che non contemplano flessibilità. Per tale ragione, spesso si rendono incomunicabili con i collaboratori che masticano business, marketing o altri ambiti.

Inoltre, considerando che il data scientist compie un tipo di lavoro totalmente incomprensibile ai non addetti ai lavori, ha sempre necessità di interfacciarsi con gli stakeholder, comprenderne le idee e i bisogni fino a tradurli in azioni concrete informatizzate.

Il buon data scientist, perciò, deve riuscire ad adattare il suo linguaggio all’interlocutore, deve imparare a relazionarsi in modo efficace e a mostrare i suoi risultati in maniera comprensibile agli altri. Per questo negli ultimi anni è notevolmente aumentato l’ausilio di grafici e infografiche, capaci di tradurre architetture di dati complessi in qualcosa di più accessibile agli occhi altrui.

Inoltre, suggerisce Davenport citando il rapporto McKinsey del 2011, l’azienda stessa deve possedere una “mentalità data-driven”.

« Il report riconosceva nel decision-making basato sui fatti (e non sulle sensazioni) un aspetto della cultura aziendale fortemente indicativo del potenziale economico dei big data e sosteneva che negli Stati Uniti la gestione dei progetti sui big data avrebbe richiesto un milione e mezzo di manager competenti. (p. 165) »

La posizione dei data scientist è molto rilevante per un’azienda che utilizzi i big data, e l’intraducibilità del suo operato porta il professionista a ricoprire ruoli di grande responsabilità, dove hanno contatti diretti con il top management. In alcune aziende, come in Quid e in Recorded Future, il data scientist è addirittura CEO dell’azienda.

Questa rilevanza di ruolo li rende particolarmente ambiziosi, unitamente alla forte esigenza (dovuta alla loro particolare strutturazione cognitiva basata sull’apprendimento veloce) di ricevere continui stimoli intellettuali e di crescita professionale.

« I data scientist sono di solito persone che desiderano incidere in modo significativo sul proprio ambiente, anzi sul mondo. (p.101) »

L’analista quantitativo

Il data scientist deve anche, ragionevolmente, sapere lavorare con i numeri e la statistica. I big data sono insiemi di dati che non solo cambia molto rapidamente, ma che inoltre non risultano mai ben strutturati: nello stesso tempo, una ricerca su Google Immagini fatta da smartphone apporta dati di tipo testuale (la parola cercata), un’immagine scelta, la geolocalizzazione, la direzione in cui ci stiamo muovendo, la frequenza con cui cerchiamo parole affini, eccetera. Questi dati non sono quasi mai strutturati, e vanno comunque codificati per renderli fruibili al machine learning, strumento capace di apprendere le nostre azioni virtuali.

Per lavorare con questi dati complessi, è molto difficile che le aziende trovino persone competenti in tutti i loro aspetti. Si rende dunque necessaria la creazione di team di data scientist, che devono collaborare fianco a fianco per ottenere una visione olistica dei dati da interpretare.

Questo ha portato le grandi aziende a creare delle strategie mirate allo scopo di favorire tale collaborazione. Ad esempio, Google inserisce minimo due data scientist in uno stesso ufficio, propone pasti gratuiti e di buona qualità per trattenerli in azienda, fornisce addirittura un servizio navetta per farli tornare a casa insieme dopo il lavoro. Queste occasioni collegiali garantiscono a Google che i suoi dipendenti rimangano estremamente ancorati gli uni agli altri, favorendo lo scambio di idee e, quindi, la creatività.

L’esperto di business

Infine, il data scientist deve comprendere in modo approfondito il tipo di business con cui sta trattando, poiché ogni sua azione informatizzata deve essere mirata a uno scopo ben preciso.

Davenport identifica tre motivi per cui un’azienda dovrebbe essere interessata ai big data e, di conseguenza, ad assumere data scientist: la riduzione dei costi, il miglioramento delle decisioni e il miglioramento dei prodotti e dei servizi (p. 30).

Per ottenere uno o più di questi obiettivi, il lavoro del data scientist deve essere produttivo all’ennesima potenza. Tale orientamento al risultato è talmente estremo, che in aziende come LinkedIn, dove i data scientist hanno un ruolo più che rilevante (basti pensare che sono più di 100), essi sono portati a costruire potenti software in grado di rimpiazzare il loro stesso lavoro per rendenderlo, così, molto più produttivo.

« Nel limite del possibile il fattore umano dovrebbe quindi essere eliminato dai processi operativi, oppure circoscritto allo sviluppo iniziale di regole e di algoritmi di scoring, oltre che alla gestione di eventuali rettifiche alle risultanze analitiche e di casi particolari. Naturalmente l’esperto conserverà comunque il ruolo di responsabile dell’analisi nelle applicazioni orientate alla ricerca e all’esplorazione, perché in tali contesti i processi di analisi e di decisione sono normalmente più lenti. (p. 104-105) »

Per cui, sebbene i data scientist desiderino stimoli frequenti, essi devono sapersi adattare anche a compiti per loro meno interessanti come quello del data management.

Il ruolo dello Chief Analytics Officer

I data scientist, anche quando collaborano tra loro, restano sempre indipendenti nei loro compiti, ed è per questo che ricoprono spesso le più alte cariche aziendali.

In generale, i team di data scientist sono formati da tre figure principali: i data hacker, esperti nell’estrarre e strutturare i dati; gli analisti quantitativi, che spiccano nel loro modellamento e infine il reparto IT che fornisce le infrastrutture su cui lavorare. Questi tre non lavorano semplicemente in trio, ma costituiscono gruppi più o meno ampi per ogni sottotipologia professionale. Ciò significa che occorrerebbe un responsabile che gestisca e coordini ciascuna sottocategoria, tuttavia Davenport allerta i manager che questa potrebbe non essere la soluzione più efficace.

Molto meglio assumere un unico responsabile dei data scientist, una figura che compare sempre più di frequente nelle grandi aziende: lo Chief Analytics Officer.

Davenport non fornisce molte informazioni su come le aziende possano accalappiarsi il loro Chief Analytics Officer ideale ma, essendo un data scientist che controlla e gestisce altri data scientist, penso che assuma nell’immaginario delle forme quasi sovra-umane.

Annalisa Viola

Annunci

Informazioni su Annalisa Viola

Psicologa
Questa voce è stata pubblicata in Professioni Emergenti (HR) e contrassegnata con , , , , , , , . Contrassegna il permalink.

2 risposte a Data Scientist: i 5 volti del mago dei Big Data

  1. Pingback: Data Scientist: i 5 volti del mago dei Big Data - NEO

  2. Pingback: Psicologo: una professione in crisi? | Psybernetic and More

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...