> Il dato è la definizione di un’esperienza umana. > I dati sono (artefatti creati dall’osservazione e dal lavoro umano su, ndr) cose che succedono, che esistono o si percepiscono e che qualcuno decide di osservare, contare e classificare.[^1] > Il dato, come concetto astratto, può essere visto come il livello minimo di astrazione da cui derivano (deriviamo, ndr) informazione e conoscenza.[^2] > Data is about measurement, understanding and description of ~~reality~~ a human experience. Il processo della [[datificazione]] (o creazione dei dati) si compone di tre fasi: osservazione, comprensione (interpretazione) e descrizione (restituzione). ## Fase 1: misurazione La prima fase di creazione del dato avviene nel momento in cui iniziamo a esplorare e osservare un fenomeno o un oggetto e a misurarlo secondo il nostro interesse. È il momento più delicato di costruzione del dato, in cui ci facciamo le domande su cosa ci interessa fare attenzione e cosa invece non è importante. È un processo di semplificazione della nostra esperienza o di quella che possiamo chiamare “realtà”. Lo scopo della creazione dei dati è la comprensione di una porzione di “realtà”, non oggettiva ma che dipende dalla nostra esperienza diretta e dal nostro [[Posizionamento]]: la prospettiva dalla quale guardiamo la realtà attraverso la nostra esperienza umana. > Il processo di conversione dell'esperienza di vita in dati comporta sempre necessariamente una **riduzione di quell'esperienza**.[^3] Prendi una penna. Che dati possiamo ottenere su una penna? Come possiamo descriverla? Costruiamo un dato definendo degli attributi, delle caratteristiche che osserviamo nell’oggetto di analisi, che possiamo chiamare variabili: - Funzione, categorie di appartenenza dell’oggetto (attributi qualitativi) - Dimensioni, peso, colore dell’oggetto (dati quantitativi) - Ordine - Attributi non ordinabili (nome) ## Fase 2: organizzazione Quello che comprendiamo attraverso i dati non avviene attraverso un’osservazione passiva ma attraverso una costruzione attiva di significato da parte di chi osserva. Il processo di comprensione e di attribuzione di significato ai dati avviene attraverso un processo di elaborazione e analisi che dipende da quello che possiamo fare con i dati attraverso la loro organizzazione: - Attribuire le variabili - Distinguere le variabili - Filtrare (vedere solo una variabile) - Ordinare (metterli in ordine) - Raggruppare (aggregarli per variabili) - Relationare (metterli in relazione) - Attribuire una gerarchia (parent-child) - Contestualizzare nel tempo - Contestualizzare nello spazio ## Fase 3: rappresentazione È la fase di descrizione dell’esperienza umana nel processo di comprensione (interpretazione) di ciò che abbiamo osservato. Anche il processo di comunicazione delle informazioni che abbiamo ottenuto dipende dal nostro [[Posizionamento]] e da ciò che riteniamo sia importante comunicare dal nostro punto di vista privilegiato. Possiamo usare la comunicazione visuale e la percezione visiva per rivelare le storie che emergono e che decidiamo di raccontare attraverso i dati in maniera immediata. La percezione visiva non funziona attraverso gli occhi ma attraverso il cervello. Il design è la modalità e lo strumento che usiamo per dare voce alle storie che vogliamo raccontare. William Playfair, padre della data visualization, ha inventato le tecniche moderne di line chart, bar chart, pie chart. #### Visual literacy Abbiamo un’abilità innata di leggere, scrivere e creare immagini visive 1987: La visualizzazione dell’informazione diventa scienza Edward Tufte > Visualizzare i dati significa offrire una prospettiva privilegiata su un fenomeno. 1. [[I dati non sono neutri, sono situati|I dati non sono neutri e oggettivi]], ma possono essere utilizzati per sostenere la propria posizione 2. Lo stesso può essere fatto con la visualizzazione 3. La scelta della visualizzazione dipende da ciò che si vuole raccontare ## Il dato ha valore se messo in relazione L’informazione che attribuiamo ai dati deriva dal confronto fra i dati stessi che abbiamo raccolto e la messa in relazione con il contesto attraverso cui li interpretiamo. Le relazioni fra i dati raccolti vengono codificate con le strutture dati. Possiamo distinguere due diverse tipologie di strutture di dati: - Dati strutturati: collezione di dati, tra loro coerenti, codificati in una struttura che ne esplicita le relazione (tabella) - Dati non strutturati: forme espressive che possono contenere dati, la cui struttura è mutevole e non coerente (testi, immagini) ### Strutturare dati non strutturati ### Tipi di strutture dato - Matrici - Liste (dataset) - XML (Extensible Markup Language) - JSON (JavaScript Object Notation) [^1]: Donata Columbro, Ti Spiego il Dato, 2021 [^2]: [Dato (wikipedia)](https://it.wikipedia.org/wiki/Dato) [^3]: Catherine D’Ignazio e Lauren Klein, Data Feminism, 2020