Merise (prononcer /mə.ʁiz/) est une méthode d'analyse, de conception et de gestion de projet informatique.
Merise a été très utilisée dans les années 1970 et 1980 pour l'informatisation massive des organisations. Cette méthode reste adaptée pour la gestion des projets internes aux organisations, se limitant à un domaine précis. Elle est en revanche moins adaptée aux projets transverses aux organisations, qui gèrent le plus souvent des informations à caractère sociétal (environnemental et social) avec des parties prenantes.
Issue de l'analyse systémique, la méthode Merise est le résultat des travaux menés par René Colletti, Arnold Rochfeld et Hubert Tardieu dans les années 1970 et qui s'inséraient dans le cadre d'une réflexion internationale[réf. nécessaire], autour notamment du modèle relationnel d'Edgar Frank Codd. Elle est devenue un projet opérationnel au début des années 1980 à la demande du ministère de l'industrie, et a surtout été utilisée en France, par les SSII de ses membres fondateurs (Sema-Metra, ainsi que par la CGI Informatique) et principalement pour les projets d'envergure, notamment des grandes administrations publiques ou privées.
Merise, méthode spécifiquement française, a d'emblée connu la concurrence internationale de méthodes anglo-saxonnes telles que SSADM (en), SDM/S ou Axial. Elle a ensuite cherché à s'adapter aux évolutions rapides des technologies de l'informatique avec Merise/objet, puis Merise/2 destinée à s'adapter au client-serveur. Merise était un courant majeur des réflexions sur une « Euro-Méthode » qui n'a pas réussi à percer.
Dans le livre de référence présentant la méthode Merise, la préface rédigée par Jacques Lesourne introduisait une analogie avec le merisier « qui ne peut porter de beaux fruits que si on lui greffe une branche de cerisier : ainsi en va-t-il des méthodes informatiques bien conçues, qui ne produisent de bons résultats que si la greffe sur l'organisation réussit », même si beaucoup de gens ont voulu y voir un acronyme comme « Méthode d'Étude et de Réalisation Informatique par les Sous-Ensembles » ou (« pour les Systèmes d'Entreprises »), « MEthode pour Rassembler les Idées Sans Effort » ou, pour les mauvaises langues, « Méthode Éprouvée pour Retarder Indéfiniment la Sortie des Études »[1].
Dans Merise deuxième génération, la définition générale du système comprend les étapes suivantes[2] :
La méthode Merise est une méthode d'analyse, de conception et de réalisation de systèmes d'informations[3].
En amont, elle se situait dans le prolongement naturel d'un schéma directeur, souvent conduit suivant la méthode RACINES, très présente notamment dans le secteur public.
Les projets Merise étaient généralement des projets de grande ampleur de refonte d'un existant complexe, dans un environnement grand système. La méthode a aussi connu des tentatives d'adaptation avec les SGBD relationnels, les différentes interfaces homme-machine IHM, l'Orienté objet, le développement micro, les outils CASE, la rétroingénierie... mais qui n'ont pas connu le même succès.
La méthode est essentiellement française. Elle a des équivalents à l'étranger en ce qui concerne les modèles de données (avec des différences, par exemple, les cardinalités ne sont pas aussi détaillées dans les modèles anglosaxons). En revanche, la modélisation des traitements est beaucoup plus complexe que dans les méthodes anglo-saxonnes.
Sa mise en œuvre peut paraître lourde. On consacre beaucoup de temps à concevoir et à prédocumenter avant de commencer à coder, ce qui pouvait sembler nécessaire à une époque où les moyens informatiques n'étaient pas aussi diffusés qu'aujourd'hui. Cela dit, elle évite l'écueil inverse du développement micro, qui souffre du manque de documentation, et où les erreurs sont finalement très coûteuses à réparer a posteriori.
Même si les échanges et la consultation entre concepteurs et utilisateurs sont formellement organisés, on a aussi reproché à Merise d'utiliser un formalisme jugé complexe (surtout pour les modèles de données), qu'il faut d'abord apprendre à manier, mais qui constitue ensuite un véritable langage commun, puissant et rigoureux pour qui le maîtrise.
L'articulation très codifiée et bien balisée des différentes étapes, avec un descriptif très précis des résultats attendus, est ce qui reste aujourd'hui de mieux connu et de plus utilisé.
La méthode Merise d'analyse et de conception propose une démarche articulée simultanément selon 3 axes pour hiérarchiser les préoccupations et les questions auxquelles répondre lors de la conduite d'un projet[5] :
La méthode Merise, très analytique (attention méthode systémique), distingue nettement les données et les traitements, même si les interactions entre les deux sont profondes et s'enrichissent mutuellement (validation des données par les traitements et réciproquement). Certains auteurs (Merise/méga, puis Merise/2) ont également apporté la notion complémentaire de communication, vues au sens des messages échangés. Aujourd'hui, avec les SGBD-R, l'objet, les notions de données et de traitements sont de plus en plus imbriqués.
La littérature parle de « courbe du soleil », établissant une analogie entre la démarche Merise et le lever puis le coucher du soleil : de même, le projet doit élaborer une analyse critique de l'existant (en partant du niveau physique et en s'élevant jusqu'au conceptuel : démarche bottom-up, phase ascendante de la courbe), puis décliner la solution retenue (en partant du niveau conceptuel et revenant au niveau physique : démarche top-down, phase descendante de la courbe).
Le recensement de l'existant est très décrié de nos jours, car il augmente la durée du projet et inciterait à reconduire les solutions existantes. Il semble néanmoins assez rationnel de commencer par un bilan du passé. Sur ce point, la démarche Merise est à l'opposé des méthodes itératives de type RAD, ou de l'adoption systématique des bonnes pratiques observées dans d'autres entreprises du secteur, qui constituent une démarche typique dans l'implémentation de progiciels. Merise/Mega insiste aussi beaucoup plus sur l'analyse de l'état de l'art pour chercher des solutions innovantes.
L'étude conceptuelle Merise s'attache aux invariants de l'entreprise ou de l'organisme du point de vue du métier : quelles sont les activités, les métiers gérés par l'entreprise, quels sont les grands processus traités, de quoi parle-t-on en matière de données, quelles notions manipule-t-on ?... et ce indépendamment des choix techniques (comment fait-on ?) ou d’organisation (qui fait quoi ?) qui ne seront abordés que dans les niveaux suivants.
Au niveau conceptuel, on veut décrire, après abstraction, le modèle (le système) de l'entreprise ou de l'organisme :
Dans l'idéal, le MCD et le MCT d'une entreprise sont stables, à périmètre fonctionnel constant, et tant que le métier de l'entreprise ne varie pas. La modélisation ne dépend pas du choix d'un progiciel ou d'un autre, d'une automatisation ou non des tâches à effectuer, d'une organisation ou d'une autre, etc.
Le MCD repose sur les notions d'entité et d'association et sur les notions de relations. Le modèle conceptuel des données s'intéresse à décrire la sémantique du domaine (entity/relationship en anglais).
L'entité est définie comme un objet de gestion considéré d'intérêt pour représenter l'activité à modéliser (exemple : entité pays). À son tour, chaque entité (ou objet) est porteuse d'une ou plusieurs propriétés simples, dites atomiques (exemples : code, nom, capitale, population, superficie) dont l'une, unique et discriminante, est désignée comme identifiant (exemple : code).
L'entité représente le concept qui se décline, dans le concret, en occurrences d'individus.
Par exemple :
sont deux occurrences de l'entité « pays » et sont constituées de n-uplets de propriétés, que le code FR ou DE suffit à identifier sans risque de doublon.
Par construction, le MCD impose que toutes les propriétés d'une entité ont vocation à être renseignées (il n'y a pas de propriété « facultative »).
Le MCD doit, de préférence, ne contenir que le cœur des informations strictement nécessaires pour réaliser les traitements conceptuels (cf. MCT). Les informations calculées (ex : montant taxes comprises d'une facture), déductibles (ex : densité démographique = population / superficie) et a fortiori celles liées aux choix d'organisation conçus pour effectuer les traitements (cf. MOT) ne doivent pas y figurer.
L'association est un lien sémantique entre entités :
Une association peut également être porteuse d'une ou plusieurs propriétés (ex : 'date d'implantation' d'une usine dans un pays)
Cette description sémantique est enrichie par la notion de cardinalité, celle-ci indique le nombre minimum (0 ou 1) et maximum (1 ou n) de fois où une occurrence quelconque d'une entité peut participer à une association (ex : une usine est implantée dans un (card. min=1) et un seul (card. max=1) pays; et réciproquement un pays peut faire l'objet soit d'aucune (card. min=0) implantation d'usine soit de plusieurs (card. max=n). On a donc les combinaisons suivantes
Il existe deux types d'associations : les CIF (contrainte d'intégrité fonctionnelle) et les CIM (contrainte d'intégrité multiple). Les CIF ont pour particularité d'être binaires et d'avoir une cardinalité min à 0 ou 1 et une cardinalité max à 1 ou n, de plus elles ne sont pas porteuses de propriétés. Les CIM sont n-aires et ont toutes leurs cardinalités max à n, de plus elles peuvent être porteuses de propriétés. Les associations ne sont plus utilisés aujourd'hui avec l'avènement de la programmation MVC. Le Modèle n'est pas censé contrôler les données, travail dévolu au contrôleur.
Le MCT repose sur les notions d'évènement et d'opération, celle de processus en découle.
Un événement est assimilable à un message porteur d'informations donc potentiellement de données mémorisables (par exemple : l'événement 'commande client à prendre en compte' contient au minimum l'identification du client, les références et les quantités de chacun des produits commandés).
Un évènement peut :
Une opération se déclenche uniquement par le stimulus d'un ou de plusieurs évènements synchronisés
Elle est constituée d'un ensemble d'actions correspondant à des règles de gestion de niveau conceptuel, stables pour la durée de vie de la future application (ex: pour la prise en compte d'une commande : vérifier le code client (présence, validité), vérifier la disponibilité des articles commandés...).
Le déroulement d'une opération est ininterruptible : les actions à réaliser en cas d'exceptions, les évènements résultats correspondants doivent être formellement décrits (ex : en reprenant l'exemple précédent, si le code client indiqué sur la commande est incorrect prévoir sa recherche à partir du nom ou de l'adresse indiqués sur la commande, s'il s'agit d'un nouveau client prévoir sa création et les informations à mémoriser...)
Un processus est une vue du MCT correspondant à un enchaînement pertinent d'opérations du point de vue de l'analyse (ex : l'ensemble des événements et opérations qui se déroulent entre la prise en compte d'une nouvelle commande et la livraison des articles au client).
À ce niveau de préoccupation, les modèles conceptuels sont précisés et font l'objet de choix d’organisation. On construit :
Comme son nom l'indique, l'étude d’organisation s'attache à préciser comment on organise les données de l'entreprise (MLD) et les tâches ou procédures (MLT). Pour autant, les choix techniques d'implémentation, tant pour les données (choix d'un SGBD) que pour les traitements (logiciel, progiciel), ne seront effectués qu'au niveau suivant.
La façon dont seront conservés les historiques des données fait également partie de ce niveau de préoccupation.
(également appelée dérivation) du MCD dans un formalisme adapté à une implémentation ultérieure, au niveau physique, sous forme de base de données relationnelle ou réseau, ou autres (ex : simples fichiers).
La transcription d'un MCD en modèle logique des données ou encore appelé schéma relationnel s'effectue selon quelques règles simples qui consistent d'abord à transformer toute entité en table, avec l'identifiant comme clé primaire, puis à observer les valeurs prises par les cardinalités maximum de chaque association pour représenter celle-ci soit (ex : card. max 1 [1-1 ou 0-1]) par l'ajout d'une clé étrangère dans une table existante, soit (ex : card. max n [0-N ou 1-N]) par la création d'une nouvelle table dont la clé primaire est obtenue par concaténation de clés étrangères correspondant aux entités liées, exemple :
PAYS(code_pays)
USINE(id_usine, @code_pays, date_implantation)
EXPORT(@id_usine, @code_pays)
Depuis les années 90, le formalisme du modèle relationnel précise explicitement la notion de clé primaire et les dépendances de référence (clés étrangères) entre les tables :
PAYS(code_pays)
code_pays : clé primaire de la relation PAYS
USINE(id_usine, code_pays, date_implantation)
id_usine : clé primaire de la relation USINE
code_pays : clé étrangère de la relation USINE en référence à code_pays de la relation PAYS
EXPORT(id_usine, code_pays)
id_usine + code_pays : clé primaire de la relation EXPORT [concaténation de id_usine et de code_pays]
id_usine : clé étrangère de la relation EXPORT en référence à id_usine de la relation USINE
code_pays : clé étrangère de la relation EXPORT en référence à code_pays de la relation PAYS
Les opérateurs de l'algèbre relationnelle (projection, sélection, jointure, opérateurs ensemblistes) peuvent ensuite directement s'appliquer sur le modèle relationnel ainsi obtenu et normalisé. (Voir Langage de requête et Formes normales.)
Cette démarche algorithmique ne fournit pas à ce niveau d'élément sur l'optimisation de la durée ou des ressources nécessaires pour exécuter les traitements dans l'environnement de production cible.
La transcription du MCD en MLD doit également être précédée d'une étape de synchronisation et de validation des modèles de données (MCD) et de traitement (MCT et MLT), au moyen de vues. Cela afin d'y introduire les informations d'organisation définies au MLT, d'éliminer les propriétés conceptuelles non utilisées dans les traitements ou redondantes et enfin de vérifier que les données utilisées pour un traitement sont bien atteignables par 'navigation' entre les entités/relations du MCD.
Le MLT, appelé aussi MOT pour « modèle organisationnel des traitements », décrit avec précision l’organisation à mettre en place pour réaliser une ou, le cas échéant, plusieurs opérations figurant dans le MCT. Il répond aux questions suivantes : qui ? quoi ? où ? quand ? À un MCT correspondent donc généralement plusieurs MLT.
Les notions introduites à ce niveau sont : le poste de travail, la phase, la tâche et la procédure.
Les réponses apportées à ce dernier niveau permettent d'établir la manière concrète dont le système sera mis en place.
Un projet élaboré selon la méthode Merise est composé de différentes phases :
Peter Chen présente la classification suivante des différents modèles « entité-association »[7] :
Merise utilise un « modèle » avec entités, attributs (ou propriétés) et relations (ou associations)
En termes formels, on dira qu'un MCD est un invariant.
On y spécifie des ensembles, des relations dont on donne les propriétés (fonction (totale ou partielle), fonction injective, surjective, relation quelconque). On utilise pour cela des « cardinalités » (appelées en UML, des multiplicités). Il y a 16 cas de relations.
En termes de mathématiques ensemblistes, un attribut est une fonction. Par exemple date_de_naissance est une fonction de l'ensemble Personnes vers l'ensemble Dates, date_de_décès est une fonction partielle de l'ensemble Personnes vers l'ensemble Dates.
Les fonctions (au sens mathématique) sont exprimées par ce qui est appelé "clé" (même sens que celui du "modèle relationnel n-aire" de Codd) et aussi par les "cardinalités" (0-1 pour les fonctions partielles) et (1-1 pour les fonctions totales). Quand la fonction a comme partie gauche un produit cartésien entre entités de types différents (entre plusieurs rectangles), on parle de CIF (Contrainte d'Intégrité Fonctionnelle).
La méthode Merise est souvent reconnue comme une méthode adaptée à la modélisation de gros projets. Sa capacité à modéliser des projets courts et de taille modeste est par contre parfois contestée. Beaucoup s'accordent à penser que son utilisation nécessite en fait d'être modulée souplement en fonction de la nature du projet, et non utilisée de façon excessivement rigide. Les schémas les plus couramment utilisés sont le MCD, le MLD et le MCT sous la forme de diagramme événement-résultat pour représenter la dynamique des processus.
Certains affirment qu'elle serait mal adaptée aux environnements distribués, où de multiples applications externes à un domaine viennent interagir avec l'application à modéliser ; cela peut fort surprendre étant donné que cette méthode développe longuement les aspects de l'informatique distribuée, notamment dans l'ouvrage d'Hubert Tardieu, Arnold Rochfeld et René Colletti traitant de celle-ci (voir bibliographie ci-dessous). Merise ne semblerait pas, selon certains, adaptée d'autre part à modéliser des informations à caractère sémantique, telles les documents... Il est à signaler, d'une part, que la méthode a fait l'objet de travaux complémentaires dans les années 1990 au sein de l'AFCET (Association française pour la cybernétique économique et technique). D'autre part, elle s'est poursuivie par des réflexions, menées par Mokrane Bouzeghoub et Arnold Rochfeld sur les architectures informatiques et les orientations objet.
Dans la pratique, les grands concurrents dans la modélisation informatique, les notations UML et BPMN associées à des processus comme UP, RUP ou 2TUP par exemple, sont en passe de supplanter la modélisation Merise, moins adaptée à représenter les objets en programmation objet. Cependant, il est très courant de recourir au MLD (schéma relationnel) et surtout au MLT (diagramme événement-résultat) de par leur facilité de lecture et les lacunes d'UML dans le domaine de la représentation de la dynamique des processus globaux[réf. nécessaire].
Sur les méthodes d'urbanisation ou de modélisation :
Sur la gestion de projet :
Sur les jointures :