
MOTIVAZIONE
Un aspetto affascinante della scienza è il modo in cui i diversi campi di studio interagiscono e si influenzano a vicenda. Molti progressi significativi sono emersi dall’interazione sinergica di più discipline. Ad esempio, la concezione della meccanica quantistica è una teoria che unisce l’idea di Planck dei livelli energetici quantizzati, l’effetto fotoelettrico di Einstein e il modello atomico di Bohr.
Il grado in cui le idee e gli artefatti di un campo di studio sono utili al mondo è una misura della sua influenza.
Sviluppare una migliore percezione dell’influenza di un settore presenta numerosi vantaggi, come comprendere cosa favorisce una maggiore innovazione e cosa la soffoca, cosa un settore riesce a comprendere e cosa rimane sfuggente, o quali sono i principali stakeholder che ne traggono vantaggio e chi viene lasciato indietro.
Meccanismi di influenza da campo a campo sono complessi, ma un notevole indicatore di influenza scientifica sono le citazioni. La misura in cui un campo di origine cita un campo di destinazione è un indicatore approssimativo del grado di influenza del campo di destinazione sulla fonte. Notiamo qui, tuttavia, che non tutte le citazioni sono uguali e soggette a vari pregiudizi. Tuttavia, è possibile trarre conclusioni significative a livello aggregato; ad esempio, se la percentuale di citazioni da field X ad un campo obiettivo sì è notevolmente aumentato rispetto alla proporzione di citazioni provenienti da altri campi rispetto al target, allora è probabile che l’influenza di X SU sì è cresciuto.
WPerché la PNL?
Sebbene studiare l’influenza sia utile per qualsiasi campo di studio, ci concentriamo sulla ricerca sull’elaborazione del linguaggio naturale (PNL) per un motivo fondamentale.
La PNL è a un punto di flesso. I recenti sviluppi di grandi modelli linguistici hanno catturato l’immaginazione del mondo scientifico, dell’industria e del pubblico in generale.
Pertanto, la PNL è pronta a esercitare un’influenza sostanziale nonostante i rischi significativi. Inoltre, il linguaggio è sociale e le sue applicazioni hanno implicazioni sociali complesse. Pertanto, la ricerca e lo sviluppo responsabili necessitano del coinvolgimento di un’ampia fascia di letteratura (probabilmente, più per la PNL che per altri campi).
Tracciando centinaia di migliaia di citazioni, esaminiamo sistematicamente e quantitativamente le tendenze generali nell’influenza di vari campi di studio sulla PNL e l’influenza della PNL su di essi.
Noi usiamo Studioso di semantica attributo del campo di studio per classificare i documenti in 23 campi, come matematica, medicina o informatica. Un documento può appartenere a uno o più campi. Ad esempio, un articolo che prende di mira un’applicazione medica utilizzando algoritmi informatici potrebbe riguardare la medicina e l’informatica. La stessa PNL è un sottocampo interdisciplinare di informatica, apprendimento automatico e linguistica. Classifichiamo un documento come PNL quando è nel file Antologia dell’ACLche è probabilmente il più grande archivio di letteratura sulla PNL (anche se non un set completo di tutti i documenti sulla PNL).
- 209 milioni di articoli e 2,5 b citazioni da vari campi (Semantic Scholar): per ogni citazione, il campo di studi dell’articolo citato e citato.
- Studioso di semantica attributo del campo di studio per classificare i documenti in 23 campi, come matematica, medicina o informatica.
- 77.000 articoli sulla PNL dal 1965 al 2022 (Antologia ACL)
Fonte: towardsdatascience.com