> Il dato è la definizione di un’esperienza umana.
> I dati sono (artefatti creati dall’osservazione e dal lavoro umano su, ndr) cose che succedono, che esistono o si percepiscono e che qualcuno decide di osservare, contare e classificare.[^1]
> Il dato, come concetto astratto, può essere visto come il livello minimo di astrazione da cui derivano (deriviamo, ndr) informazione e conoscenza.[^2]
> Data is about measurement, understanding and description of ~~reality~~ a human experience.
Il processo della [[datificazione]] (o creazione dei dati)
si compone di tre fasi: osservazione, comprensione (interpretazione) e descrizione (restituzione).
## Fase 1: misurazione
La prima fase di creazione del dato avviene nel momento in cui iniziamo a esplorare e osservare un fenomeno o un oggetto e a misurarlo secondo il nostro interesse.
È il momento più delicato di costruzione del dato, in cui ci facciamo le domande su cosa ci interessa fare attenzione e cosa invece non è importante.
È un processo di semplificazione della nostra esperienza o di quella che possiamo chiamare “realtà”.
Lo scopo della creazione dei dati è la comprensione di una porzione di “realtà”, non oggettiva ma che dipende dalla nostra esperienza diretta e dal nostro [[Posizionamento]]: la prospettiva dalla quale guardiamo la realtà attraverso la nostra esperienza umana.
> Il processo di conversione dell'esperienza di vita in dati comporta sempre necessariamente una **riduzione di quell'esperienza**.[^3]
Prendi una penna. Che dati possiamo ottenere su una penna? Come possiamo descriverla?
Costruiamo un dato definendo degli attributi, delle caratteristiche che osserviamo nell’oggetto di analisi, che possiamo chiamare variabili:
- Funzione, categorie di appartenenza dell’oggetto (attributi qualitativi)
- Dimensioni, peso, colore dell’oggetto (dati quantitativi)
- Ordine
- Attributi non ordinabili (nome)
## Fase 2: organizzazione
Quello che comprendiamo attraverso i dati non avviene attraverso un’osservazione passiva ma attraverso una costruzione attiva di significato da parte di chi osserva.
Il processo di comprensione e di attribuzione di significato ai dati avviene attraverso un processo di elaborazione e analisi che dipende da quello che possiamo fare con i dati attraverso la loro organizzazione:
- Attribuire le variabili
- Distinguere le variabili
- Filtrare (vedere solo una variabile)
- Ordinare (metterli in ordine)
- Raggruppare (aggregarli per variabili)
- Relationare (metterli in relazione)
- Attribuire una gerarchia (parent-child)
- Contestualizzare nel tempo
- Contestualizzare nello spazio
## Fase 3: rappresentazione
È la fase di descrizione dell’esperienza umana nel processo di comprensione (interpretazione) di ciò che abbiamo osservato.
Anche il processo di comunicazione delle informazioni che abbiamo ottenuto dipende dal nostro [[Posizionamento]] e da ciò che riteniamo sia importante comunicare dal nostro punto di vista privilegiato.
Possiamo usare la comunicazione visuale e la percezione visiva per rivelare le storie che emergono e che decidiamo di raccontare attraverso i dati in maniera immediata. La percezione visiva non funziona attraverso gli occhi ma attraverso il cervello.
Il design è la modalità e lo strumento che usiamo per dare voce alle storie che vogliamo raccontare.
William Playfair, padre della data visualization, ha inventato le tecniche moderne di line chart, bar chart, pie chart.
#### Visual literacy
Abbiamo un’abilità innata di leggere, scrivere e creare immagini visive
1987: La visualizzazione dell’informazione diventa scienza
Edward Tufte
> Visualizzare i dati significa offrire una prospettiva privilegiata su un fenomeno.
1. [[I dati non sono neutri, sono situati|I dati non sono neutri e oggettivi]], ma possono essere utilizzati per sostenere la propria posizione
2. Lo stesso può essere fatto con la visualizzazione
3. La scelta della visualizzazione dipende da ciò che si vuole raccontare
## Il dato ha valore se messo in relazione
L’informazione che attribuiamo ai dati deriva dal confronto fra i dati stessi che abbiamo raccolto e la messa in relazione con il contesto attraverso cui li interpretiamo.
Le relazioni fra i dati raccolti vengono codificate con le strutture dati.
Possiamo distinguere due diverse tipologie di strutture di dati:
- Dati strutturati: collezione di dati, tra loro coerenti, codificati in una struttura che ne esplicita le relazione (tabella)
- Dati non strutturati: forme espressive che possono contenere dati, la cui struttura è mutevole e non coerente (testi, immagini)
### Strutturare dati non strutturati
### Tipi di strutture dato
- Matrici
- Liste (dataset)
- XML (Extensible Markup Language)
- JSON (JavaScript Object Notation)
[^1]: Donata Columbro, Ti Spiego il Dato, 2021
[^2]: [Dato (wikipedia)](https://it.wikipedia.org/wiki/Dato)
[^3]: Catherine D’Ignazio e Lauren Klein, Data Feminism, 2020