Improve transformations infos writing in db
Normalisation dans la BDD des infos sur les images avant / post transformation
-
Informations sur les datasets : nom | real / fake / mixed | [data-domain] | [générateurs]
-> dans le yaml et géré dans le dataset_accessor => ajouter une validation dans le typing ; -
Informations sur les générateurs : nom, version du modele, "famille", year
-> TBD, on veut ses informations mais on voudrait garder les Literal (valider aussi dans le yaml) ; -
Informations sur les transfos : dans le constants, doit contenir seulement les transfos albumentations + celles des modèles utilisés (normalement ça se recouvre), les customs sont à retirer (p ex social_media) + mettre des jolis noms -
cf code infos utiles pré-transformations ➡️ à mettre dans une base dataset_info avant de faire les transfos et inférences, en faisant une jointure sur le path des images avec la base transformation_info
à garder en tête : utiliser le plus facilement possible les datasets huggingface (p ex pouvoir lire plus intelligemment des métadonnées sur les images pour les datasets "mixed")
(suite à discussion avc @vigids6)
Edited by Gaspard Defréville