I Big Data sappiamo bene che sono in continua espansione: stanno crescendo più velocemente che mai ed entro il 2020, verranno creati circa 1,7 megabyte di nuove informazioni ogni secondo per ogni essere umano sul pianeta. A quel punto, il nostro universo digitale di dati accumulato crescerà da 4,4 zetabyte oggi a circa 44 zetabyte, o 44 trilioni di gigabyte.
Questo, ovviamente, ha molte implicazioni per ogni business: bisogna pensare necessariamente di adottare una soluzione che trasformi i dati da quantitativi a qualitativi, e pensare di assumere risorse in grado di utilizzare gli strumenti di Data Analysis.
Ma quali sono queste skill necessarie per una risorsa? Quali sono le cose da sapere? Noi di Engineering 365 abbiamo pensato di stilare qualche skill utile per diventare un Data Analyst.
Ci concentreremo sulle competenze di un Data Analyst.
E’ vero che gli strumenti possono variare dall’azienda per cui si lavora, dal settore, e dal ruolo esatto che si ricopre. E’ anche vero, però, che strumenti come Microsoft SQL Server sono fondamentali per il successo in questo campo.
- Pulizia e preparazione dei dati
La ricerca mostra che la pulizia e la preparazione dei dati rappresentano circa l’80% del lavoro dei professionisti dei dati. Questo lo rende forse l’abilità chiave per chiunque sia seriamente interessato a ottenere un lavoro come Data Analyst.
Comunemente, un Data Analyst dovrà recuperare i dati da una o più fonti e prepararli in modo che siano pronti per l’analisi numerica e categoriale. La pulizia dei dati comporta anche la gestione di dati mancanti e incoerenti che possano influire sull’analisi.
Il data cleaning non sembra essere un’attività accattivante, a prima vista, in realtà è un lavoro estremamente strategico e pieno di potenziali criticità da risolvere. In ogni caso, è una delle prime attività per diventare Data Analyst.
- Data Analysis ed esplorazione
Potrebbe sembrare ridondante parlare di “Data Analysis” come competenza per un Data Analyst: ma l’analisi stessa è un’abilità specifica che deve essere padroneggiata. Fondamentalmente, Data Analysis significa prendere una domanda o una necessità di business e trasformarla in una domanda di dati. Quindi, sarà necessario trasformare e analizzare i dati per estrarre una risposta a quella domanda. Un’altra forma di Data Analysis è l’esplorazione. L’esplorazione dei dati cerca di trovare tendenze o relazioni interessanti nei dati che potrebbero apportare valore a un’azienda. L’esplorazione potrebbe essere guidata da una domanda commerciale originale, ma potrebbe anche essere relativamente non guidata. Cercando modelli e segnali nei dati, si potrebbe trovarvi un’opportunità per l’azienda di ridurre i costi o aumentare la crescita.
- Conoscenza statistica
Una solida base di probabilità e statistica è un’importante capacità per un Data Analyst. Questa conoscenza aiuterà a guidare l’analisi e l’esplorazione supportando la comprensione dei dati con cui si sta lavorando. Inoltre, comprendere le statistiche aiuterà a verificare che l’analisi sia valida evitando comuni fallacie ed errori logici. L’esatto livello di conoscenza statistica richiesto varierà a seconda delle esigenze del ruolo particolare e dei dati con cui si ha a che fare. Ad esempio, se l’azienda si affida all’analisi probabilistica, una comprensione molto più rigorosa di quelle aree sarà un requisito fondamentale.
- Creazione di Data Visualization
Le visualizzazioni dei dati semplificano la comprensione di tendenze e modelli nei dati. Gli esseri umani sono creature visive e la maggior parte delle persone non sarà in grado di ottenere una visione significativa guardando un foglio di calcolo gigante di numeri. Ogni Data Analyst, dovrà essere in grado di creare diagrammi e grafici per comunicare visivamente dati e risultati. Creando dashboard e report, si darà ad altri l’accesso a dati importanti rimuovendo le barriere tecniche. Questo potrebbe assumere la forma di un semplice grafico e una tabella con filtri di data, fino a un grande pannello di controllo contenente centinaia di punti dati interattivi e che si aggiornano automaticamente. Ciò significa creare grafici chiari e visivamente accattivanti che aiuteranno gli altri a comprendere i dati. Significa anche evitare cose che siano difficili da interpretare (come i grafici a torta) o che possano essere fuorvianti (come manipolare i valori degli assi). Power BI, lo strumento Microsoft di business intelligence, leader nel Magic Quadrant di Gartner da 12 anni consecutivi, offre strumenti agili e smart per creare report e grafici, specifici ed accattivanti, nonché estremamente chiari e comprensibili. La Data Visualization, non solo è una competenza fondamentale per ogni buon Data Analyst, ma è molto importante per rintracciare delle potenziali criticità che in una Data Analysis non sempre sono visibili a “occhio nudo”.
- Competenze comunicative
La comunicazione è fondamentale per collaborare con i colleghi. Ad esempio, in un incontro preliminare con gli stakeholder aziendali, sono necessarie attente capacità di ascolto per comprendere le Data Analysis di cui hanno bisogno. Allo stesso modo, durante il progetto, potrebbe capitare di spiegare un argomento complesso a compagni di squadra non tecnici. Essere chiari, diretti e facilmente comprensibili è un’abilità che farà la differenza per l’avanzamento di carriera. Potrebbe essere una “soft skill“, ma le migliori capacità analitiche al mondo non varranno molto se non si è in grado di spiegare cosa significano i dati e convincere i colleghi ad agire sulle analisi.
- Problem Solving
Come Data Analyst è facile imbattersi in problemi, bug e criticità ogni giorno. Potrebbe essere necessario ricercare una stranezza di alcuni software o linguaggio di codifica che si sta utilizzando. L’azienda potrebbe avere vincoli di risorse così da ricercare soluzioni innovative per affrontare un problema: capacità tecniche unite a capacità strategiche. I dati utilizzati potrebbero essere incompleti, oppure ci potrebbero essere delle analisi urgenti con scadenza incombente. Qualunque siano le circostanze, le forti capacità di problem solving saranno una risorsa incredibile per qualsiasi Data Analyst.