Da Hiroshima a ChatGPT: il legame imprevisto tra intelligenza artificiale, acciaio e nucleare

John Graham-Cumming, ex CTO di Cloudflare, lancia lowbackgroundsteel.ai: un archivio digitale che raccoglie e preserva testi, immagini e video creati da esseri umani prima dell’avvento dell’IA generativa, per salvaguardare la memoria creativa autentica
di Andrea Bai pubblicata il 19 Giugno 2025, alle 14:41 nel canale Scienza e tecnologiaCosa c'entra l'intelligenza artificiale con l'acciaio e i test nucleari dell'era atomica nel secondo conflitto mondiale? Concretamente nulla, ma ci sono delle interessanti attinenze che hanno portato John Graham-Cumming, ex Chief Technology Officer di Cloudflare a lanciare lowbackgroundsteel.ai, un sito web che si propone di catalogare e preservare i contenuti creati dagli esseri umani prima dell'avvento massivo dell'intelligenza artificiale generativa.
Ok, ma l'acciaio e il nucleare? Il collegamento concettuale è semplice: allo stesso modo in cui, nell'epoca del progetto Manhattan, del Trinity Test e dei successivi bombardamenti su Hiroshima e Nagasaki, le esplosioni nucleari hanno contaminato la produzione mondiale di acciaio (per via di una maggior quantità di radionuclidi presenti nell'aria), la crescente presenza di contenuti generati dall'IA rischia di contaminare e rendere indistinguibili le opere autenticamente prodotte dall'essere umano.
Dopo il 1945 la comunità scientifica, a fronte della necessità di realizzare strumenti sensibili e affidabili, si adoperò per recuperare l'acciaio "puro", prodotto prima del 1940, da relitti navali precedenti al conflitto bellico: questo materiale era conosciuto con il nome di "low-background steel", da cui Graham-Cumming ha tratto ispirazione per battezzare il servizio di preservazione dell'espressione creativa genuina dell'umanità.

L'arrivo dei modelli generativi, testuali, di immagini e video, ha reso via via più complesso verificare se un contenuto sia stato prodotto integralmente dall'essere umano, anzi, la contaminazione operata da parte dell'IA ha già portato alla chiusura di wordfreq, un importante progetto di ricerca che si proponeva di tracciare l'evoluzione linguistica in oltre 40 lingue diverse. La necessità di preservare il frutto dell'intelletto umano nasce anche dal rischio del possibile "collasso dei modelli", e cioè il progressivo degrado della qualità dei modelli stessi quando continuano a procedere nell'addestramento usando dati generati da altre IA, in quella sorta di "cannibalismo digitale" di cui avevamo già avuto modo di parlare lo scorso anno.
Ma come funziona lowbackgroundsteel.ai? Il portale raccoglie e segnala archivi di contenuti pre-IA, come il dump di Wikipedia dell’agosto 2022 (prima del rilascio di ChatGPT), la collezione di libri di pubblico dominio di Project Gutenberg, l’archivio fotografico della Library of Congress e l’Arctic Code Vault di GitHub, una "istantanea" del codice open source mondiale sepolta nelle isole Svalbard nel 2020. Anche il progetto wordfreq è incluso, “congelato” prima che l’IA rendesse impossibile la sua metodologia. Il sito accetta segnalazioni di altre fonti di contenuti pre-IA tramite la sua pagina Tumblr.
Graham-Cumming sottolinea che il progetto non vuole essere una presa di posizione contro l’intelligenza artificiale, ma intende documentare la creatività umana prima dell’era delle macchine. Il sito, tra l'altro, era stato creato a marzo del 2023, ma tenuto sotto traccia fino ad oggi.
Così come Il ritorno ai livelli naturali di radiazione ha reso il recupero dell'acciao low-background meno fondamentale per molte applicazioni (in alcuni casi, specie per la costruzione di apparecchiature particolarmente sensibili si utilizza ancora), è possibile che nei prossimi anni l'evoluzione dell'IA possa far seguire la stessa sorte ai contenuti pre-IA. La protezione dei frutti della creatività e dell'intelletto umani, resta tuttavia fondamentale in ottica di patrimonio storico per consentire in futuro di verificare l'autenticità dei contenuti, l'evoluzione del linguaggio e della comunicazione prima della pervasione delle IA.
3 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - infoSpero di sbagliarmi ma la vedo molto nera se non si metterà un freno a questa cosa
[I]The increasing use of LLMs and other generative AI is adding vast quantities of AIgenerated content to the online data environment, thereby contaminating it: Future AIs continue to be trained on data from the internet, and thus partly on their own (collective) output. However, this feedback loop can have detrimental effects, to the point where newly trained AI models can collapse and become useless. Removing AI-generated content from data sets is already difficult, and may well become impossible as it further improves, leading to a risk of a perpetually contaminated information sphere. As future AIs will continue to require large uncontaminated data sets, they may increasingly need to rely on data collected prior to the proliferation of generative AI, that is prior to the end of 2022. Alongside existing barriers to entry such as compute resources, electricity, and human talent, this new barrier may become insurmountable, thereby leaving newcomers in the generative AI market behind and allowing existing players to further entrench their dominant positions.[/I]
Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".