Parametrizace ekvalizace elektronegativity (EEM) metodou diferenciální evoluce Pazúriková J.1,3, Raček T.1,2, Svobodová Vařeková R.2, Křenek A.3, Geidl S.2, Koča J.2 1 Fakulta informatiky, Masarykova univerzita, Botanická 68a, 602 00 Brno, 2 Národní centrum pro výzkum biomolekul, Přírodovědecká fakulta a CEITEC – Středoevropský technologický institut, Masarykova Univerzita Brno, Kamenice 5, 625 00 Brno-Bohunice 3 Ústav výpočetní techniky, Masarykova univerzita, Botanická 68a, 602 00 Brno Teoretický koncept parciálních atomových nábojů, který zjednodušeně popisuje rozložení elektronové hustoty na molekule, je používán v mnoha metodách výpočetní chemie. Samotné parciální náboje mohou být určeny ab-initio výpočty, ty jsou ale pro běžné použití příliš náročné. Alternativou jsou metody empirické jako je ekvalizace elektronegativity EEM [EEM]. Nutností EEM metody je ale jejich prvotní parametrizace na základě tréninkové sady molekul, pro něž byly parciální nápoje spočteny pomocí kvantové mechaniky. Obvyklým přístupem stanovení parametrů je jednoduchá regrese metodou nejmenších čtverců pro parametry popisující atomové typy (A,B) opakovaná pro parametr charakterizující dosah elektrostatické interakce (kappa) [NEEMP]. To ale v řadě případů vede k ne zcela uspokojivým výsledkům. Přesnější alternativou je globální optimalizace prostoru parametrů, popsaná řešení [DE] ale zpravidla velmi pomalu konvergují k přijatelnému výsledku. V této práci navržený algoritmus vhodně kombinuje globální optimalizaci metodou diferenciální evoluce pro nalezení přibližných slibných řešení a optimalizaci lokální metodou přímých kvadratických aproximací [Powell] k jejich finálnímu zpřesnění. Druhou hlavní inovací je rozšíření možností tzv. scorovací funkce, která hodnotí kvalitu parametrů, tak, že kombinuje celkový korelační koeficient R^2, vážený průměr korelací jednotlivých atomových typů, RMSE apod. Algoritmus byl vyhodnocen na třech výrazně odlišných datových sadách (velikost sady, velikost molekul, typy atomů). Scorovací funkce preferující RMSE se ukazuje jako nejvhodnější, při velikosti populace algoritmu DE 500 metoda uspokojivě konverguje po pouhých 1000 krocích. Na všech datových sadách dostáváme typické hodnoty RMSE cca. 0.1, celkovou korelaci R^2 > 0.9 a korelace na jednotlivých typech atomů obvykle alespoň 0.7. Tyto výsledky jsou na malých datových sadách srovnatelné s uvedenou jednoduchou metodou, na větších sadách jsou výrazně lepší. [EEM] W. J. Mortier, S. K. Ghosh, and S. Shankar, “Electronegativity-equalization method for the calculation of atomic charges in molecules,” Journal of the American Chemical Society, vol. 108, no. 15, pp. 4315–4320, 1986. [NEEMP] S. Geidl, T. Bouchal, T. Raček, R. Svobodová Vařeková, V. Hejret, A. Křenek, R. Abagyan and J. Koča. High-quality and universal empirical atomic charges for chemoinformatics applications. Journal of Cheminformatics, London: BioMed Central Ltd, 2015. [Powell] Powell, M. J. D. (2004). "Least Frobenius norm updating of quadratic models that satisfy interpolation conditions". Mathematical Programming (Springer) 100: 183–215. [DE] R. Storm, K. Price, Differential Evolution – A Simple and Efficient Heuristic for global Optimization over Continuous Spaces, Journal of Global Optimization, Volume 11, Issue 4, pp. 341-359, 1997