Una possibilità di ottimizzare un sistema a scatola nera utilizzando modelli surrogati algebrici identificati utilizzando un approccio di regressione simbolica.
Eseguire un’ottimizzazione è un compito molto interessante. Nella nostra vita quotidiana, potremmo essere interessati al modo migliore per metterci al lavoro nel più breve tempo possibile, o magari alla migliore dimensione delle particelle del nostro caffè macinato per ottenere una tazza di caffè davvero gustosa ☕. Le industrie sono anche interessate a ottimizzare aspetti, come le catene di approvvigionamento, le emissioni di carbonio o l’accumulo di rifiuti.
Esistono numerose possibilità su come impostare un’ottimizzazione, a seconda di come si presenta la situazione particolare. Vorrei dividere queste situazioni in due parti per questo articolo:
Da un lato potremmo avere conoscenze sulla fisica, la chimica o i prodotti biologici che guidano il sistema oggetto di studio. Con questo potremmo sistemarci equazioni algebriche che descrivono accuratamente ciò che osserviamo (principi primi). Queste situazioni consentono l’utilizzo di solutori standard, come GLPK, BARONE, ANTIGONE, FFSo altri, poiché abbiamo espressioni in forma chiusa e possiamo calcolarne le derivate.
D’altra parte, potremmo non avere un’idea reale di come appare o si comporta il nostro sistema. Un modo per ricavarne alcune informazioni sarebbe eseguire esperimenti, ovvero definire alcuni input e osservare cosa succede nell’output. Per ottimizzare un sistema del genere, potremmo utilizzare l’euristica, come l’ottimizzazione dello sciame di particelle, applicare un algoritmo genetico o utilizzare tecniche potenti come l’ottimizzazione bayesiana.
Potremmo immergerci profondamente nella letteratura e in molte discussioni ora. Ma manteniamolo semplice qui. Concentriamoci solo sul secondo caso, in cui non abbiamo una descrizione matematica accurata e in forma chiusa del nostro sistema, o non abbiamo tempo per crearne una perché siamo impegnati a bere un caffè ☕. Supponiamo anche di avere alcune osservazioni passate, ma non possiamo campionare nuovi dati dal nostro sistema per qualsiasi motivo.
Una situazione del genere potrebbe verificarsi quando si lavora con materiali molto costosi, come i prodotti farmaceutici. Potresti aver prodotto alcuni lotti di prodotti farmaceutici in passato, ma non puoi produrne un altro solo per il bene…
Fonte: towardsdatascience.com