W wielu dziedzinach biologii strukturalnej możliwe jest generowanie syntetycznych
obrazów reprezentujących interesujące zjawiska. Takie obrazy, choć uproszczone
i pozbawione wielu detali typowych dla rzeczywistych danych biologicznych,
posiadają wyznaczoną algorytmicznie wartość etykiety (ang. ground-truth). Z drugiej
strony, obszerne zbiory realnych obrazów z mikroskopii elektronowej pozostają
w dużej mierze nieopisane, ponieważ ręczne etykietowanie wymaga rzadkiej wiedzy
eksperckiej i jest niezwykle czasochłonne. Tworzy to znaczną lukę między dwoma
ważnymi domenami: danymi syntetycznymi (łatwymi do etykietowania, lecz zbyt
uproszczonymi) a danymi rzeczywistymi (bogatymi w szczegóły, lecz
nieetykietowanymi).
Pracując z roboczym przykładem polikrystalicznych struktur (typu diament),
znajdujących się w ciałach prolamellarnych w chloroplastach roślin, przedstawię
(zalążek) metody, która pokonuje tę lukę. Prace te są prowadzone we
współpracy z Grupą Nanomorfologii Plastydów na Wydziale Biologii oraz
CNBCh Uniwersytetu Warszawskiego.
In many areas of structural biology it is possible to generate synthetic images
representing the phenomenon of interest. Such images, although simplified and
lacking many details typical of real biological data, come with an algorithmically
determined ground-truth label. Conversely, large collections of real electron
microscopy images remain largely unannotated, as manual labeling requires rare
expert knowledge and is highly time-consuming. This creates a substantial gap
between two important domains: synthetic data (easy to label but oversimplified)
and real data (rich in detail but unlabeled).
Using polycrystalline diamond-like structures found in prolamellar bodies in plant
chloroplasts as a working example, I will show (the inception of) a method that
can bridge this gap. This is a work in progress done in collaboration with the
Plastid Nanomorphology Group at the Faculty of Biology and CNBCh, University of
Warsaw.