## Fichier de parametre comment

## Ici on cherche a extraire un modele de la forme XXXXXX___XXXX apparaissant
## dans au moins 5% des sequences, avec une erreur autorisee dans un des deux
## blocs. Le saut entre les deux blocs est compris entre 3 et 6 bases.



CARACTERISTIQUES GLOBALES =========================
FASTA file              fasta       ## nom du fichier FASTA utilise pour l'extraction
Output file             exemple     ## fichier resultat
Alphabet file           alphabet    ## fichier indiquant l'alphabet sur lequel
                                    ## on va construire les modeles
## Dans ce fichier alphabet, il suffit d'indiquer les groupes de symboles qu'on souhaite
## associer (voir aussi le fichier 'alpha').

## Caracteristiques des modeles a extraire

Quorum                  4           ## pourcentage des sequences minimal dans lesquelles un
                                    ## modele doit apparaitre pour etre retenu
Total min length        12          ## longueur minimale totale du modele
Total max length        0           ## longueur maximale totale du modele (0 pour infinie)
Total substitutions     1           ## nb total d'erreurs autorisees tous blocs confondus
Boxes                   2           ## nb de blocs d'un modele, pas de limitation


BOX 1 ================             ## caracteristiques du bloc 1
Min length              6           ## longueur min du bloc 1
Max length              0           ## longueur max du bloc 1 (0 pour infinie)
Substitutions                 1           ## nb d'erreurs du bloc 1
Min spacer length       17          ## longueur du saut min vers le bloc suivant
Max spacer length       19          ## longueur du saut max vers le bloc suivant

BOX 2 ================
Min length              6           ## longueur min du bloc 2
Max length              0           ## longueur max du bloc 2
Substitutions           1           ## nb d'erreurs max du bloc 2


## Ici la seconde partie d'evaluation des modeles trouves lors de l'extraction.
## On a le choix entre deux methodes:
##  1) Shuffling: generer des sequences shufflees ayant le meme biais de composition
##     que la sequence FASTA originale et effectuer des calculs statistiques
##     sur les differences de frequences observees.
##     Le fichier exemple.shuffle sera genere.
##  2) Contre: comparer les frequences des modeles obtenus avec celles observees dans
##     des sequences dites "fausses" dans laquelle on pense ne pas trouver ces
##     modeles.
##     Le fichier exemple.against sera genere.
EVALUATION ====================================
## Ici on choisit la methode 1 qui se lance ainsi:
Shufflings              100         ## nombre de generations/comparaison avec
                                    ## sequences shufflees a effectuer
Size k-mer              3           ## taille des k-uplets a conserver lors du
                                    ## shuffling

## Les fichiers suivants montrent d'autres fonctionnalites:
##      - param_1bloc montre le cas simple de la recherche de modeles
##        composes d'un seul bloc, avec un alphabet degenere,
##      - param_contre montre comment utiliser la methode 2 d'evaluation,
##      - param_delta montre comment utiliser les "deltas".

