You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
## Utilizzare la libreria Pandas per eseguire statistiche su dati tabellari.
22
+
## Utilizzare la libreria Pandas per eseguire statistiche su dati di una tabella.
23
23
24
24
-[Pandas](https://pandas.pydata.org/) è una libreria Python molto utilizzata per le
25
-
statistiche, in particolare per i dati tabellari.
25
+
statistiche, in particolare per leggere e manipolare tabelle.
26
26
- Prende in prestito molte caratteristiche dai dataframe di R.
27
27
- Una tabella bidimensionale le cui colonne hanno nomi e potenzialmente tipi di dati
28
28
diversi.
@@ -61,8 +61,7 @@ print(data_oceania)
61
61
osservazioni.
62
62
- Pandas usa la backslash `\` per mostrare le righe avvolte quando l'output è troppo
63
63
ampio per adattarsi allo schermo.
64
-
- L'uso di nomi descrittivi per i dataframe ci aiuta a distinguere tra più dataframe, in
65
-
modo da evitare di sovrascrivere accidentalmente un dataframe o di leggere da quello
64
+
- L'uso di nomi descrittivi per i dataframe ci aiuta a distinguere tra più dataframe, in modo da evitare di sovrascrivere accidentalmente un dataframe o di leggere da quello
66
65
sbagliato.
67
66
68
67
::::::::::::::::::::::::::::::::::::::::: callout
@@ -72,8 +71,7 @@ print(data_oceania)
72
71
Le nostre lezioni memorizzano i loro file di dati in una sottodirectory `data`, motivo
73
72
per cui il percorso del file è `data/gapminder_gdp_oceania.csv`. Se si dimentica di
74
73
includere `data/`, o se lo si include ma la propria copia del file si trova da qualche
75
-
altra parte, si otterrà un [runtime error](04-built-in.md) che termina con una riga come
76
-
questa:
74
+
altra parte, si otterrà un [runtime error](04-built-in.md) che termina con una riga come questa:
77
75
78
76
```error
79
77
FileNotFoundError: [Errno 2] No such file or directory: 'data/gapminder_gdp_oceania.csv'
@@ -140,18 +138,17 @@ memory usage: 208.0+ bytes
140
138
141
139
- Questo è un `DataFrame`
142
140
- Due righe denominate `'Australia'` e `'New Zealand'`
143
-
- Dodici colonne, ciascuna delle quali contiene due valori effettivi in virgola mobile a
144
-
64 bit.
141
+
- Dodici colonne, ciascuna delle quali contiene due valori effettivi in virgola mobile a 64 bit.
145
142
- Parleremo in seguito dei valori nulli, utilizzati per rappresentare le osservazioni
146
143
mancanti.
147
144
- Utilizza 208 byte di memoria.
148
145
149
146
## La variabile `DataFrame.columns` memorizza informazioni sulle colonne del dataframe.
150
147
151
-
-Si noti che questi sono dati, *non* un metodo. (Non ha parentesi)
148
+
-Nota che questo è un dato,*non* un metodo. (non ha parentesi)
152
149
- Come `math.pi`.
153
150
- Quindi non usare `()` per cercare di chiamarlo.
154
-
-Chiamata*variabile membro*, o semplicemente *membro*.
151
+
-Si chiama*variabile membro*, o semplicemente *membro*.
## Usare `DataFrame.T` per trasporre un dataframe.
168
165
169
166
- A volte si desidera trattare le colonne come righe e viceversa.
170
-
- La trasposizione (scritta `.T`) non copia i dati, ma cambia solo la visione del
171
-
programma.
167
+
- La trasposizione (scritta `.T`) non copia i dati, ma cambia solo la visione della tabella
172
168
- Come `columns`, è una variabile membro.
173
169
174
170
```python
@@ -269,8 +265,8 @@ data_americas.describe()
269
265
Dopo aver letto i dati relativi alle Americhe, utilizzate `help(data_americas.head)` e
270
266
`help(data_americas.tail)` per scoprire cosa fanno `DataFrame.head` e `DataFrame.tail`.
271
267
272
-
1. Quale chiamata di metodo visualizzerà le prime tre righe di questi dati?
273
-
2. Quale chiamata di metodo visualizzerà le ultime tre colonne di questi dati?
268
+
1. Quale metodo visualizzerà le prime tre righe di questi dati?
269
+
2. Quale metodo visualizzerà le ultime tre colonne di questi dati?
274
270
(Suggerimento: potrebbe essere necessario modificare la visualizzazione dei dati)
275
271
276
272
::::::::::::::: solution
@@ -279,8 +275,7 @@ Dopo aver letto i dati relativi alle Americhe, utilizzate `help(data_americas.he
279
275
280
276
1. Possiamo controllare le prime cinque righe di `data_americas` eseguendo
281
277
`data_americas.head()` che ci permette di visualizzare l'inizio del DataFrame. È
282
-
possibile specificare il numero di righe che si desidera visualizzare specificando il
283
-
parametro `n` nella chiamata a `data_americas.head()`. Per visualizzare le prime tre
278
+
possibile specificare il numero di righe che si desidera visualizzare specificando il parametro `n` nella chiamata a `data_americas.head()`. Per visualizzare le prime tre
284
279
righe, eseguire:
285
280
286
281
```python
@@ -323,8 +318,7 @@ Dopo aver letto i dati relativi alle Americhe, utilizzate `help(data_americas.he
323
318
americas_flipped = data_americas.T
324
319
```
325
320
326
-
Possiamo quindi visualizzare le ultime tre colonne di `americas` visualizzando le ultime
327
-
tre righe di `americas_flipped`:
321
+
Possiamo quindi visualizzare le ultime tre colonne di `americas` visualizzando le ultime tre righe di `americas_flipped`:
Oltre alla funzione `read_csv` per leggere i dati da un file, Pandas fornisce una
415
409
funzione `to_csv` per scrivere i dataframe sui file. Applicando quanto appreso sulla
416
-
lettura dei file, scrivete uno dei vostri dataframe in un file chiamato`processed.csv`.
410
+
lettura dei file, scrivete uno dei vostri dataframe in un file chiamato`processed.csv`.
417
411
È possibile utilizzare `help` per ottenere informazioni su come utilizzare `to_csv`.
418
412
419
413
::::::::::::::: solution
@@ -434,10 +428,7 @@ help(data_americas.to_csv)
434
428
help(pd.read_csv)
435
429
```
436
430
437
-
Si noti che `help(to_csv)` o `help(pd.to_csv)` danno errore! Ciò è dovuto al fatto che
438
-
`to_csv` non è una funzione globale di Pandas, ma una funzione membro di DataFrames. Ciò
439
-
significa che può essere chiamata solo su un'istanza di un DataFrame, ad esempio
440
-
`data_americas.to_csv` o `data_oceania.to_csv`
431
+
Si noti che `help(to_csv)` o `help(pd.to_csv)` generano un errore! Ciò è dovuto al fatto che `to_csv` non è una funzione globale di Pandas, ma una funzione membro di DataFrames. Ciò significa che può essere chiamata solo su un'istanza di un DataFrame, ad esempio `data_americas.to_csv` o `data_oceania.to_csv`
441
432
442
433
443
434
@@ -447,7 +438,7 @@ significa che può essere chiamata solo su un'istanza di un DataFrame, ad esempi
0 commit comments