Peptydy to krótkie łańcuchy aminokwasowe, które pełnią wiele ważnych biologicznych funkcji (np. przeciwdrobnoustrojowe). Z tych względów badacze poszukują nowych peptydów o potencjalnie istotnych funkcjach, co jednak jest bardzo czaso- i kosztochłonne w warunkach laboratoryjnych. Dlatego też często stosuje się metody uczenia maszynowego, począwszy od modeli liniowych, po uczenie głębokie, które umożliwiają szybkie i tanie wykrywanie określonych grup peptydów w danych genomicznych i metagenomicznych. W mojej prezentacji pokazuję nie tylko proces tworzenia takich narzędzi, ale również problemy z tym powiązane takie jak brak odpowiednich danych (10.1093/nar/gkac882) oraz nierzetelne benchmarki (10.1093/bib/bbac343).