REPUBLIQUE DU SENEGAL ~III I’cuplc - Iln Ilut -...
REPUBLIQUE DU SENEGAL
~III I’cuplc - Iln Ilut - Ilnr Foi
MINISTERE DE L’AGRICULTURE
INSTITUT Smms DE RECHERCHES AGFUCOLES
Route des Hydrocarbures - Bel-Air - Tel : (22 I ) 832-24-3 l/23 Fax : (22 I ) 832-24-27 - BP 3 120 - DAKAR - (Sénkpal)

SOMMAIRE
1
INTRODUCTION ...................................................................................................................................
1
2
PRINCIPES D E LA PLANIFICATION EXPERIMENTALE..............................................................
2
2.1
LA RANDOMISATION.......................................................................................................................~
.... 2
2.2
LES REPETITIONS ................................................................................................................................
2
2.3
LE CONTROLE DE L'ERRE~R...........................................................~.................................................~
.... 2
3
PRINCIPALES ETAPES D E LA PLANIFICATION EXPERIMENTALE.. .......................................
4
3.1
LADEFINITION DE L'OBJEC!TIF EXPIIRUIENTAL.............................................................................~
........ 4
3.2
LA DEFINITION DES FACTEURS AE~~IER .............................................................................................
4
3.3
LA DEFINITION DES CONDITIONS EXPERIMENTALES ..............................................................................
1
3.4
LA DEFINITION DES UNITES EXPERIMENTALES .......................................................................................
5
3.5
LA DEFINITION DES MESURES ETOHSERVATIONS.. .........................................................................
....... . 5
3.6
LE CHOIX DU DISPOSITIF EXPERIMENTAL...............................................................................................
5
3.61
L e dispositif en randomisation totale ..........................................................................................
5
3.6.2
Le dispositif en blocs complets randomisés. ...................................................................
........... 6
3.6.3
L e dispositif en split plot .....................................................................................................
..... 6
3.6.4
Les dispositif en blocs incomplets équilibré.~ ......................................................................
..... /i
3.7
LADETERMINATXON DUNOMBREDEREPETTTIONS .................................................................................
7
3.8
LA DETERMINATION DE LAMETHODED'ANALYSE STATISTIQUE ..........................................................
S
4
INTRODUCTION AU LXODELE LU’?EAIRE .......................................................................................
9
4.1
PRESENTATION D'U MODELE LINEAIRE .................................................................................................
9
4.2
HYPOTHESES DU MODELE LINEAIRES .....................................................................................................
9
4.3
ESTIMATION DES P ARAMETRES DU MODELE ........................................................................................
10
4.4 TEST D 'HYPOTHESE~ LINEAIRES ..................................................................................................
11
5
L’ANALYSE DE LA VARIANCE........................................................................................................
1-t
5.1
PRINCIPES DE L'ANALYSEDELA VARIANCE.. .....................................................................................
11
5.2
ANALYSE DE LAVA~IANCE AUN FACTEUR ETUDIE ..............................................................................
15
5.2.1
/Inova à un facteur en randomisation totale.. .......................................................................
... 1-i
5.2.2
.4nova à un facteur dans un dispositifen blocs aléatoires complets.. .........................................
16
5.3
ANALYSE DE LA VARIANCE ADEIJXFACTEmS ETUDIES .....................................................................
17
5.3.1
.4nova à deux facteurs en randomisation totale .........................................................................
l&
5.3.2
.4nova à deux facteurs étudieis dans un dispositif en blocs alèatoires complets.........................
19
-5.3.3
.4nova à deux facteurs dans un dispositif en split plot ...........................................................
10
5.4
LES METHODES DECOMPARAISON DES MOYENNES.. .........................................................................
21
.5.-i. 1
La méthode de la plus petite diférence sign(ficative
................................
..................... .....
.? 1
5.4 2
La méthode de Bonferroni .......................................................................................................
2:
.5.4.3
La méthode de Newman et Keuls. ...........................................................................................
33
-5.4.4
La méthode de Dunnet ........ .........................................
..... ........... ..............................
... 2i
.Y 4.5
I,a méthode des contrastes ........................................................................
.....................
.?;
5.4 Ci
/>a mkthode des po(ynômes
orthogonaux.................................................
....................
.... ... 2f,
5.5
Vr\\.IJDr\\TI<>N DES HYPOTHESES DE L,'ANALYSE DE LA \\..-\\RI.LyCI: ...........................
.................
21;
6
PUISSANCE ET DIMENSIONNEMENT D’UNE EXPERIMENTATION.. ......................................
20
6.1
R.w~r-r. : ~ST DE FISHER LORS D'L'NE .G.-U~YSI- I)I: \\..~RI.~s~I- .....................................................
29
6.2
CAI.CI:I. DE L.p\\ PIUSSANCE D'W'JE EXPERi~IENT/\\TION
....................................................................
3 i
62.1
Puissance de la comparaison de deux niveaux d ‘unfacteur ...................................................
31
62.2
Puissance d’une ana!vse de variante à un facteur comportan& plusieurs nil.eaux .....................
35
6.2.)
~“L~IMIllC~ d ‘Lm am(V.W II~ Val’lLIIIce ti plusieurs Jiiclcur.~~ cot,lportairt
ph~sieurs IIII’C~~U.~. .......... .i -
6.3
CONCl,~WON : DEMARCIIE DE CHOIX D'IT DISPOSITIF ESPERIhtl:NTAI, ET DIMENSIOSNEMI:h'T DE L'ESS.\\I.
...............................
.........................................................................................
...........................
... 3s
.-.._
_.-_
‘I-m--
---

--.-
---.---
------
---.--p>

*,._..- -,. .: Id
--,‘T
cw
7
LES REGROUPEMENT$ D’ESSAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . ..d................._.....42
T
7.1
INTROD~~CT~~~N............................................................................................................,.....,....,..........
42
7.2
EFFETS ALEATOIRES - EFFETS FIXES _.,_.._,...<,..._<__...__...._.,_.__..,............_._.............................................
42
7.2. I
Effets alèaloires.. .._.. . . . . . . . . . _. _. _. _. _. _, _. . . _.. _. _._ __ ___ j _.
_
_ 42
7.2.2
Effelsjxes . . . . . . . . . . .._.._...................._____.
. . . ..___.... _......_.,.___ _.._...........,___.__....._....__.
1. . .._._.. ._..........
42
7.3
CONDITIONS DE REALISATION DES ESSAIS hllIt,TIL,OCAIIS....................................................................
13
7.4
ANALYSE DES SERIES D'ESSAIS...........................................................................................................
43
7.4.1
Etape 1 : analyse des essais individuel.~ . .._....... ..,_._..__.................._,._.__.....__....._,,....._.
.., ,__.___.. J.i
7.4.7
Etape 2 : sélecGon des essais de nrênre variance résiduelle. ._... . .__...... . .., _. _. __. _, ._ __ __ -13
7.4.3
Etape 3 : analyse de variante du regroupetnenl. __. _. . . . _. . . . . . . . . . _. _. . 4-J
7.5
f%nJDE D'UN EXEMPLE ._............_......................_,......
__............................<.........................,.._.._.......
16
7.5. I
Etape I : analyse des essais individuels . . ..‘..
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ,.. 46
7.5.2
Etape 2 : sélection des essak de tnênre variante résiduelle . . . . _. _. _. I ._. _. ._ _. _. 4 7
7.5.3
Etape 3 : ana!vse de variante du regroupetnenr. . . . . . . _. __ ___ __. _. _. __ _.
-lh
8
L’ANALYSE D’ADAPTABILITE : UNE METHODE POUR LA MISE AU POINT ET L’
ANALYSE DES ESSAIS EN MILIEU REEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
..~.......................................-i<)
8.1
OBJECTIFS:.....~............................................................................................................................
.._. 49
8.2
DONNEES NECESSAIRES : ._...............,..,...,...,............................,.................~.............................,,.,,.....
40
8.3
CONDUITE DE L‘:ZNALySE ENVIRON~iEhlENI‘XI,IJ : . . . . . ..<_._.....__............_........ ..<<___....____._..._..._ ..__ 4')
8.3. I
C’alculer une mesure de la perfiwwatlce de chaque environnctnen~
:. _, .__ _. _. _. Jr/
Y. 3.2
twttrer et modéliser la réponse des traitements k I ‘en\\,ironi?ettretlf ,.. ..___ .._. .___. ._ ._ _. _._. __ _.. 4~
K. 3. .i
LXJfinir des domaines de réponse équivalente des fraitetnenls à I ‘ctl~~irot~tlc~ttr~~ttt.,
,. .,
311
Y. 3.4
[ klider In constitution des domaines. .._ .., ,._._ __. __. ._...... .___, ._____.. ._______,___. ,.__, ., ., ._,_. _. ___. -(I
8.3. .i
Alener une ana[vSe de variame par dottraine _. _. _. __ _. _. _. _.
,. _. _. _.
511
8.3.6
.E@ctuer une anova sur le regroupenrenl des domaines. ._____________..__. .__. ._, ._ .___. ._. ._. ._ ._. F(i
8.3. 7
Forttruler des reconttttandatiotw
inclépendanks dans chaque dontaitw _. _. . _. _. -fi
Z-3.8
Expliquer i ‘indice e,?\\lironnetttetltal par des variables caractéristiques du ttrilicu _. _. il1
H. 3.9
forrrruler les recotwtrandatiotw
en ~erttrcs de caractérisiiques du tnilicu.. _. _. _. _. _. _. _. 5 1
8.1
ETriDE I>‘L% EXEMPLE. .._._..... .._.._...._ .__...,____.. __...,,._,_..____.______._____._.________.....,_,.,.,,...__.,_.__.___.
i 1
Y.4 i
I-es donnkes. _..._. ._. .__. ,.._, ._ ___..
._. _______._
_. _._____. ._._. .__ ._. ,. __. ._. ._. ._.__. ._. 5 1
s. 4. .?
(‘nlcul de 1 ‘indice environnemental _. _. _. . . _. _. _. _. _. _.
_.
_. __ _.
.TC
K. 4.3
~\\lotlf4isalion d e ta r é p o n s e d e s Iraiternents à 1 ‘etivir(>l?t?et?iel?t. _. _.
.ï5
R. 4.4
D~fïni fion des domaines de réponse équivalente des traitements ti I ‘envirottttcttrertl. _. ji
Y. 4. .Y
I klidafion de la constitution des domaine.s (hottrogénkité des blocs) _. .__. _. ._.. .fi
8.4.0
,-In~~~v.se de variatace par domaine. __ __ _. _. __ _. _. _. __ .
_.
_.
_.
5:
s. 4. 7
Re~,atttttta,7dati~~t~~s
indépendanles dans chaque domaine.. . _. _. _.
_. _. _. 5 -
ch. 4. K
Explication de 1 ‘indice environrletrter~tal par des variables cnracltt.i.~tiqrtr.~ tlrt ttrilic~r~ ct
Fortttrrlntiott des recottttttartr~atio,7s en terttres de caract6ri.rtique.s
du milieu ._.
._.
5~
ANNEXE 1 :
CANEVAS DE PROTOCOLE EXPERIMENTAL
ANNEXE 2 :
PRESENTATION DES DONNEES AVANT ANALYSE
ANNEXE 3 :
ABAQUES DE DETERMINATION DE LA PUISSANCE D’IJNE <‘C)MPAR.~ISOK
DE PLUSIEURS MOYENNES (PEARSON ET HARTLEl’. 1951)

1 INTRODUCTION
L’expérimentation permet d’évaluer la réponse induite sur une ou plusieurs variables par la
modification d’un ou de plusieurs facteurs expérimentaux. Le plus souvent on envisage de
mener une expérimentation afin de vérifier une hypothèse suggérée par des connaissances
antérieures ou des problèmes posés à l’agriculture. Il faut alors élaborer une ;Procédure de
vérification de cette hypothèse. Cette procédure comporte différentes phases parmi lesquelles
on note:
> le choix du matériel expérimental ;
> le choix des caractères à observer ou mesurer ;
k la détermination des méthodes d’observation et de mesure ;
> la détermination des critères de validation de l’hypothèse.
Les deux premières phases ne posent souvent pas beaucoup de difficultés à l’expérimentateur
car elles relèvent essentiellement du domaine de recherche considéré. Par contre. les deux
dernières exigent un certain bagage en statistique. En effet, il faudra Sav(oir comment
déterminer une méthode fiable et précise de mesures et dans quel cadre ces mesures obtenues
permettront de valider ou d’invalider l’hypothèse.
Ainsi, à l’issue de l’expérimentation une décision sera prise, mais elle sera prise dans un
contexte incertain sujet à diverses sources de variation liées au matériel expérimental utilisé.
aux conditions expérimentales (par exemple la température, la pluviométrie, l’hétérogénéité
du sol), aux erreurs de mesure etc. La décision d’accepter ou de refuser une hypothèse sera
basée alors sur un raisonnement probabilistique ou statistique. Nous voyons dés à présent
l’importance et l’enjeu de la statistique dans le domaine de l’expérimentation agricole.
Exemple
Considérons une expérimentation mise en œuvre dans le but de comparer les rendements
potentiels de deux variétés A et B d’arachide. L’hypothèse à tester consiste à dire que ces
deux variétés produisent le même rendement. L’expérimentateur, disposant de dieux parcelles
contiguës de même taille, sème cha.cune des variétés sur une des parcelles et observe que la
variété B donne un meilleur rendement.
.
L’expérimentateur, à partir seulement de cette observation, ne pourra certainement pas
avancer une conclusion valable en vue de valider son hypothèse de travail. En effet cette
différence: observée pourrait très bien être due à des facteurs autres que la \\.ariété, en
l’occurrence une attaque d’insectes plus marquée sur la parcelle ayant reçue la variéte A, une
plus grande fertilité de la parcelle ayant reçue B pourraient par exemple expliquer cette
différence: de rendement.
Nous voyons ainsi que 1’expérime:ntateur devra planifier son expérience de telle façon a
pouvoir décider si la difl’érence observée pouvait être attribuée à un effet de la variété ou bien
être attribuée à d’autres facteurs dits; “non contrôlés” par l’expérience

.
,
2
PRINCIPESDE~LAPLANIFICATIONEXPERIMENTALI
Une planification expérimbntale de qualité peut être définie comme “kr ., mn de -fcwwir
I ‘effort expérimental mini/num pour la meilleure précision”, en d’autres
-mes le moyen
d’obtenir des résultats préils au moindre coût.
Nous mesurons dès à prés$nt toute l’importance à devoir accorder à l’étape I la planification
expérimentale dans le prbcessus de recherche. La planification expérimi
ale doit, pour
garantir la validité de l’adalyse statistique des données qui seront recueil1
1, obéir à trois
principes fondamentaux qu!z nous allons brièvement décrire.
2.1 La randomisatiob
Reprenons à présent l’exelbple précédent en considérant que nous disposon
le Six parcelles
expérimentales contiguës, les trois premières recevant la variété A et les troi utres la vari&
B
gradient de fertilité
--
-_-.-
Dans ce cas, une des var(étés pourrait être constamment favorisée, au poi
de vue de son
rendement, s’il existe par exemple un gradient de fertilité allant de la droit à la gauche du
terrain. Pour éviter toute source d’erreur systématique en avantageant un’ des variétés au
détriment de l’autre, il nouis faut procéder à la randomisation qui est une régi
J’af‘fectation au
hasard des traitements aux: unités expérimentales. Cette procédure garantit 1’
dépendance des
observations d’une unité dxpérimentale à l’autre et élimine les biais qui pel ent être induits
par une mauvaise répartitidn des traitements aux unités expérimentales.
2.2
Les répétitions
Si l’expérimentateur avait choisi de semer la même variété sur les six p
celles, il aurait
quand même sûrement dbservé une différence de rendement entre ce: 3arcelles; cette
différence est due .4 une jource de variabilité appelée erreur expérimentale
ui ne peut &re
estimée que s’il y a des ‘répétitions, c’est à dire affecter une même \\Par
é $1 différentes
parcelles expérimentales.
II est en effet nécessair: d’avoir des répétitions pour évaluer l’erreur
;périmentale et
distinguer ainsi cette eneuri de I’effe~t dG aus traitements
2.3
Le contrôle de (‘et-reuy
/
Nous venons de voir qu
les r-épétitions nous permettent d’avoir une 111 11I.L‘ de I‘er-r CllI
expérimentale. Il nous fil,“1
t, pour la réduire,
limiter l‘influence de ceit; 1s tàctclll-s 111)ll
contrôlés par l’expérienc&. Nous chercherons, pour cela, à constituer d<
reymupenientr
d’unités exl)érimentalt>s I s plus homo~knes possible. IJne part de la \\‘ar
Iilité sel-a ainsi
contrôlée et l’erreur expérimentale réduite.
1
Pour un essai au champ,! on cherchera lorsqu’un gradient d’hétérogénéite
fertilité par csemple) wt r$connu à constituer dc~.s groupes de parcelles semb
/
I
I
.,i’
‘,iliii
Cl 1;
- 3-
-

vue de leur fertilité de telle sorte que la variabilité du phénomène étudié soit plus faible entre
des unités expérimentales d’un même groupe qu’entre unités expérimentales appartenant à des
groupes différents. Les traitements seront alors répartis de manière aléatoire au niveau de
chacun de ces groupes ou blocs. Le facteur de variation lié à la fertilité du sol sera ainsi
contrôlé et l’erreur expérimentale réduite.

.
.‘.
._~_
-.
<.
6.
,
l
3
PRINCIPALESETAPESDELAPLANIFICATIONEXPENMENTALE
Après une étude bibliographique permettant de procéder à l’état des conn$ssances sur le
R
thème de recherche projeté, l’expérimentateur doit définir lors de la planification de son
expérience différents éléments dont les principaux sont :
3.1
La définition de l’objectif expérimental
Une expérience étant mise en place pour répondre à un certain objectif, il est nécessaire que
cet objectif soit défini de.wnière claire et concise. On conçoit aisément que la définition de
l’objectif expérimental détermine la réalisation de l’expérimentation et la natuie des mesures
qui seront relevées.
Les diverses questions auxquelles l’expérience devrait répondre doivent être formulées sans
ambiguïté et classées par ordre d’importance lorsque I’ob-iectif de l’expérience est multiple.
3.2
La définition des facteurs à étudier
Un facteur est défini par un ensemble d’éléments de même nature dont nous voulons étudie1
l’influence sur une certaine variable : chacun de ces éléments est appelé un niveau ou une
modalité du facteur.
Les facteurs à étudier constituent l’objet même de notre expérience. Ainsi leur nature doit être
définie avec précision ; le nombre de facteurs et le nombre de niveaux ou modalités de chacun
d’entre eux doivent être clairement déterminés.
Dans le cadre de notre exemple ci-dessus, le facteur étudié est la variété d’arachide. Les
variétés A et R c.onstituent les deux modalités de ce facteur.
Un traitement est défini par une combinaison des niveaux des différents facteurs étudiés. Dans
le cas où! un seul facteur serait étudié un traitement correspond à un niveau de ce facteur.
Exemple
A titre d’illustration considérons qu’on s’intéresse à l’étude de 2 facteurs : la variété d’arachide
à deux modalités (variété A et variété B) et l’engrais azoté à deux niveaux (dose Dl et dose
D2).
Chacune des 4 combinaisons des deux facteurs (ADI, AD3, BD 1 et BD2) constitue un
traitement.
3.3
La définition des conditions expérimentales
Les résultats d’une expérience peuvent être fortement intluencks par les condition5
expérimentales et, à cet effet, il es1 alors nécessaire de bien définir ces conditions.
Les conditions espér-imentz/les peuvent êlre pal- exemple dans le domaine
d’implantation de I’expérieilce (en staticiri, en milieu paysan), les sources
potentielles sur le site (exisience de gadient de fertilité & de salinit&), le pr&/édent cultural.
les techniques culturales etc.’

3.4
La définition des unités expérimentales
L’unité expérimentale est l’élément recevant le traitement et sur lequel porteront les
observations. Suivant le cas considéré, elle peut être une parcelle, un groupe d’arbres, un
arbre, une feuille, un animai ou un lot d’animaux.
Dans le cadre de l’exemple 3.2, une parcelle sur laquelle sera semée une des variétés et
recevant une des deux doses d’engrais définit une unité expérimentale.
Nous concevons facilement l’intérêt d’une définition précise de la nature, la forme et la taille
de l’unité expérimentale lors de la planification. Le nombre d’unités expérimentales devra
aussi être précisé.
*_
3.5
La définition des mesures et observations
Des mesures ou observations seront réalisées au niveau de chaque unité expérimentale. Ces
mesures ou observations sont les valeurs de variables, dites variables d’étucle, prises sur
l’unité considérée.
Les variables peuvent être réparties, suivant les valeurs qu’elles peuvent prendre, en variables
quantitatives et qualitatives. Nous distinguons, parmi les variables quantitatives., les variables
de nature :
k continue, par exemple le poids, le rendement, la hauteur ;
*k discrète, par exemple le nombre d’épis, le nombre d’insectes.
+ Parmi les variables qualitatives, nous distinguons les variables de nature :
i- ordinale, c’est à dire celles qui permettent de classer les individus. Une variable qui
prend les valeurs faible, moyen et fort est une variable qualitative ordinale ;
‘F nominale (à plus de deux modalités), par exemple la couleur, la variété cultivée ;
2; binaire (nominale à deux modalités), par exemple les variables qui prennent les
valeurs oui/non ou présence/absence d’un caractère ;
11 est bien évident que. la nature des mesures ou observations à réaliser est étroitement liée à
l’objectif expérimentai. Les méthodes et analyses statistiques porteront sur ces dernières et, de
ce point de vue, ii est important de réaliser ces mesures ou observations avec le plus grand
soin.
Lorsqu’une mesure ou observation devrait être réalisée par échantillonnage, le plan
d’échantillonnage devrait être défini avec toute la précision requise.
3.6
Le choix du dispositif expérimental
Le choix du dispositif expérimentai se fait en fonction de l’objectif projeté, de la structure el
du nombre de facteurs à étudier et. des conditions ou contraintes expérimentales Quelque~
dispositifs expérimentaux classiques sont brièvement présentés ci-dessus
3.61
Le dispositif en rflndoniisntion totale
IJn dispositif est dit en randomisation totale ou complètement randomisé lorsque les
traitements sont
affec.tés de manière totalement aléatoire aux
différentes unités
expérimentales.
,-~ ._.. - _.-. .- --_-_-__,_-/
-
-
-
-----.----

Le choix d’un tel dispositif est adéquat lorsque les unités expérimentales s .nt relativement
homogènes et s’adapte bik au cas où le nombre de répétitions par traitem nt ne serait pas
{
constant.
I
/
Du fait de la variabilité du! matériel expérimental en agronomie, ces dispositi s sont rarement
utilisés. En effet, iorsqu’dn
I
dispose d’informations a priori sur l’hétérogé éité des unités
expérimentales, on gagner+it en prkcision en constituant des groupes d’unité4 expérimentales
(blocs) assez homogènes e$tre elles.
1
j
3.6.2
Le dispositif en bldcs complets rnndomisk
Un bloc peut être défini pai un groupe d’unités expérimentales homogènes.
/
Un dispositif expérimental’ est dit en blocs aléatoires complets lorsque les 1 raitements sont
aléatoirement affectés aux {unités expérimentales d’un même bloc.
!
La constitution des bloc4 doit ainsi être réalisée de manière à ce que lb variabilité du
phénomène étudié soit plut faible entre unités expérimentales d’un même bioq qu’entre unités
expérimentales appartenant à des bllocs différents. La constitution judicieuse! des blocs exige
ainsi une disposition d’infoi-mation a priori.
I
Avec des critères pertinents pour la constitution des blocs, ce dispositif pen et de contr6ler
l’hétérogénéité du milieu dxpérimental et de réduire alors l’erreur expérimer r
tale II est ainsi
plus effkace que le plan coknplètement randomisé.
3.6.3
Le dispositif en sadit plot
/
Le split plot ou dispositif ,en blocs complets avec parcelles divisées Correspo/nd à un plan en
blocs avec deux facteurs étudiés dont les niveaux sont affectés aux unités expbrimentales d‘un
bloc par étapes :
I
1. on commence par subdiviser chaque bloc en autant de sous blocs que dei niveaux de l’un
des facteurs (facteur dit secondaire), les niveaux de ce facteur sont aloi c IS aléatoirement
affectés aux sous blocsid’un même bloc.
j
2. puis on aflecte, aléatoirement les niveaux de l’autre facteur (facteur dik prkipal) aux
unités expérimentales die chacun des sous blocs.
Les comparaisons relatived au facteur secondaire seront moins précises que c$l,les relati\\res au
facteur principal. L’inconkénient du dispositif en split plot réside dans cftte dissymétrie
introduite entre les deux fabteurs.
L’utilisation de ce disposi/if se justifie par exemple lorsqu’il existe des cont@intes pratiques
liées à la répartition aléatoire des traitements à l’intérieur d’un bloc ou lorsciu’on s‘intéresse
plus particulièrement à l’un des deux facteurs et/ou à l’interaction entre ces facteurs
au sein des blocs. ,,II eftèt, la taillt:
des blocs dépendant du jnombre de traitements, l’homogénéité des rmité~ expérimentale:;
constituant un bloc com let équilibré est rapidement compromise lorsqu$ Ic nonibrc
4
dt:
traitements devient élevé. ;En outre, nous nous trouvons quelquefois dans kmpossibilité de
constituer des blocs dans Iksquels tous les traitements sont présents. La solut’on sera alors de
i
constituer des blocs mcom iets c’est à dire des blocs ne comportant qt~‘une c$tame partie de:;
traitements étudiés.
- 0 -

Un plan en blocs incomplets est dit équilibré lorsque chaque couple de traitements est présent
un même nombre de fois dans un bloc. Il est dit binaire lorsqu’un traitement est présent au
plus une fois dans chaque bloc. La plupart des plans incomplets utilisés en expérimentation
agricole sont en blocs incomplets équilibrés binaires.
Lorsqu’on se limite au cas où chaque bloc comporte le même nombre d’unités expérimentales
et les traitements sont répétés un même nombre de fois, un dispositif en blocs ircomplets
équilibrés binaires vérifie :
pr=bk
h=r(k- l)/(p- 1)
p désignant le nombre de traitements, r le nombre de répétitions, b le nombre de blocs, k le
nombre d’unités expérimentales par bloc et h le nombre d’occurrences d’un couple de
traitements dans un même bloc.
Le dispositif en lattices carrés équilibrés est un dispositif avec un réseau de blocs incomplets
(bloc ligne et bloc colonne) tel que :
k la taille des blocs incomplets est la racine carrée du nombre de traitements.,
k les blocs peuvent être regroupés pour former des répétitions complètes (répliques) où
chaque traitement est présent une fois et une seule,
> le nombre de répliques est égal à un plus la racine carrée du nombre de traitements,
k chaque couple donné de traitements se retrouve une fois et une seule dans un bloc
ligne et aussi une fois et une seule dans un bloc colonne.
Ainsi pour disposer un essai en lattices carrés équilibrés, il est nécessaire ‘que le nombre de
traitements soit un carré parfait.
Exemple : Plan en lattices carrés équilibrés 3 x 3 avec p=9, k=3,1=4, b=12
Réplique 1
Réplique 2
Réplique 3
Réplique 4
Avec un nombre de traitements T = TO (To+i), nous pouvons constituer un dispositif en
lattices rectangulaires, chaque réplique comprenant (TO +l) blocs de taille To. Da.ns ce cas, un
couple de traitements se retrouvera au plus une fois dans un même bloc.
3.7 La détermination du nombre de répétitions
Nous notons souvent un manque de critères objectifs dans la détermination du nombre de
blocs et du nombre de sites d’un essa.i multilocal.
Le nombre de répétitions devrait être déterminé par la précision des résultats que l’on veut
obtenir avec une certaine probabilité en fonction de l’objectif de recherche poursuivi et de la
variabilité du matériel expérimental à utiliser. Nous pouvons utiliser des résultats
- 7 -
,_” ._.. .---
..----
-
_<^-
--,s-,
---
mm-m---------1

L
expérimentaux antérieurs OP, organiser des essais préliminaires pour avoir une ‘déc a priori de
i
la variabilité du matériel experimental.
3.8 La détermination, de la méthode d’analyse statistique
Il est fort utile d’envisagdr, dès la planification de notre expérience, la oJ les méthodes
adéquates d’analyse statistique des données qui seront collectées. Les prin ipaux facteurs
susceptibles d’orienter ce c/hoix sont l’objectif poursuivi, la nature des donnéks à analyser et
les propriétés des méthodesjstatistiques à utiliser.
Le protocole expérimental devr,ait ainsi, présenter une définition dbs hypothèses
expérimentales à vérifier, - pes paramètres à estimer, des méthodes Statistiq/ues qui seront
utilisées et une brève descn$tion des tableaux de résultats qui seront obtenus.

I
Ces divers éléments pas& en revue constituent les principaux élément4 du protocole
expérimental. Nous proposdns en annexe un canevas de protocole expérimental/
/

4
INTR~INJCT[ON Au M~IWIXLINEAIRE
4.1
Présentation du modèle linéaire
Le modèle linéaire est le modèle de base de toute la modélisation statistique. Par ses
propriétés mathématiques très intéressantes, il permet de décrire et d’analyser de très
nombreuses et diverses situations expérimentales.
Un modèle linéaire unidimensionnel à effets fixes est un modèle s’exprimant sous la forme :
(l)Y=x@+e

- Y est le vecteur de dimension n des observations ;
- @est le vecteur formé des p paramètres du modèle ;
- X est une matrice à n lignes et p colonnes formée des valeurs des facteurs expliquant la
variable étudiée ;
-_
e est une variable aléatoire résiduelle à valeurs dans 3 “.
4.2
Hypothèses du modèle linéaire
On suppose que la variable aléatoire e à valeurs dans 3 ” suit une loi normale, centrke et de
variante c? I,,.
L’espérance mathématique du vecteur Y des observations est ainsi donnée par :
E(Y) = X 0.
Nous avons ainsi une décomposition du vecteur Y des observations en une composante fixe
(l’espérance) et une composante aléatoire (résiduelle).
Exemple : modèle de régression linéaire
Lorsqu’on étudie l’effet d’une variable quantitative x (par exemple une dose d’engrais) sur
une variable quantitative y (le rendement en grain d’une variété de mil). on peut choisir de
rendre compte de cette expérience par la relation :
yi = a + bXi + e;
i = 1, . . . . 1,
avec 1 le nombre d’unités expérimentales, xi la iZmr: dose d’engrais et yi le rendement de la
parcelle recevant la dose xi. L’écriture matricielle de ce modèle est :
Yl
1 XI
l?
Y:!
1 x2
L’ ,
XI
Y1
1 x, J
e 1
-9-

Pour comparer les effets de!1 variétés de mil sur le rendement, nous disposon4 #de n parcelles
expérimentales. Chacune de$ 1 variét~és est semée sur J unités expérimentales ttrées au hasard
avec n = IJ.
1
Le modèle suivant d’analyse de variante permet de décrire et d’étudier une telle experience :
yij = p + CY.i + eij
i:= 1, ._. , I;j= 1, . . . . J.
Pour 1 = 2 et J = 3, l’expression préebdente peut s’écrire :
Y11
1 1 0
Y12
1 1 0
Y13
1 1 0
1+ “Ilel2e13
Y21
1 0 1
e 21
Y22
1 0 1
e 22
-Y23
1 0 1
e23
Nous venons ainsi de voir que les modèles de régression linéaire et d’analyse de variante sont
quelques exemples de modèle linéaire ; ils peuvent tous s’écrire sous la forme matricielle
définie par (1)
4.3
Estimation des plaramètres du modèle
L’estimation des paramètres du modèle linéaire utilise la méthode des moindres carrés. Cette
méthode consiste principalement a chercher des valeurs estimées telles que 1~ mesure de
l’écart entre les valeurs estimées et observées soit la plus petite possible.
L’estimateur des moindres carrés Ydu vecteur aléatoire observé Y est défini par la projection
orthogonale de Y sur le sous espace vectoriel engendré par les vecteurs colonnes de la matrice
X. Ainsi Yest le vecteur de ce sous espace qui minimise la somme des carrés des résidus :
P=‘(Y-?)(Y -y,,
c’est à dire des écarts entre les valeurs observées et estimées.
Le vecteur ê des résidus défini par :
ê-y-q,
est une mesure de l’écart au modèle.
Nous pouvons montrer que l’estimateur 6 de la matrice des paramètres 0 dé:fini par la
relation :
,
q LZ x6,
vérifie l’expression suivante!:
t Yxô=t XY,
qui est un système de p équations à p inconnues.
__..- -.----.---
-
-
- . _ - -
_-~-.-
_1,,<
” “‘. 1. ,‘-‘, :‘:c’r J’Y,!
- lO-

Dans le cas où le rang r de la matrice X, c’est à dire le nombre de colonnes de X qui sont
linéairement indépendantes, est ég;al à p (on dit dans ce cas que le modèle est régulier), ce
système d’équations a une solution unique donnée par :
Lorsque le rang de X est strictement ink-ieur à p (modèle singulier), le système est
indéterminé ; il admet une infinité de solutions. Pour le rendre déterminé, il suffit d’introduire
certaines contraintes linéaires sur les paramètres.
L’estimateur 6 de la matrice des paramètres 0 est un estimateur sans biais de variante
minimum. De plus, nous pouvons montrer que :
_.
S2
ô2=--
n - r
est un estimateur sans biais de o2 de variante minimum.
On peut montrer en utilisant le théorème de Pythagore que:
‘YY=W+yY-?)(Y-?)
SCT = SCM + SCR
Cette expression consiste à dire que la somme des carrés totale (SCT) se décompose en la
somme des carrés due au modèle (SCM) et la somme des carrés résiduelle (SCR). En d’autres
termes, on dira que la variation totale du phénomène observé est composée d’une part de
variation due au modèle statistique et d’une autre part de variation due à des effets aléatoires.
Nous verrons dans la suite l’importance d’une telle décomposition.
4.4
Test d’hypothèses linéaig-es
Considérons que pour comparer les effets de 1 variétés d’arachide sur une variable donnée par
exemple le rendement, nous disposions de n parcelles expérimentales. Chacune des I variétés
est semée sur J unités expérimentales choisies de façon aléatoire avec n = IJ.
Le modèle statistique suivant permet de décrire et d’étudier une telle expérience :
= J..l + ffi + eij
Yij
i=l1 ‘.. 1 1 :j = 1, . . . . J
avec yij et ecj les valeurs respectives de la variable étudiée et de la variable résiduelle (erreur
expérimentale) prises sur la jèmz unité expérimentale recevant le traitement i.
L”expérimentateur peut être intéressé par la vérification de la validité de certaines hypothèses
formulées au sujet de la population qu’il étudie. Un test d’hypothèses est un outil permettant
de procéder ;3. une telle vérification.
L’expérimentateur intéressé par la comparaison de 1 variétés d’arachide va tout d’abord
chercher à. savoir si le facteur variété a un effet sur le rendement.
Pour cela, il commence par émettre deux hypothèses :
i; l’hypothèse HO à tester ou h.ypothèse nulle consistant à afIirmer que la variété n’a pas
d’effet sur le rendement, ce qui revient à écrire :
Ho: ai = CI? = . = ar = 0 ;
- ll-
. .
.
_-__--,__
-
--w-

> l’hypothèse Hl ou hypothèse alternative consistant à affirmer que le facteur variété a
r-
bien un effet sur le rendement, ce qui revient à écrire :
Hr : 3 i (5 { 1, 2, . . . . I} tel que ai # 0.
Ensuite une règle de décision permettant de faire un choix entre les hypothèses HO et Hl sera
construite. La variabilité inhérente à toute expérimentation peut nous emmener à commettre
des erreurs dans nos prises de décision. Le tableau suivant présente les 4 situations qui
peuvent se présenter avec les probabilités correspondantes.
Situation réelle inconnue ~
Décision prise
Hc vraie
Accepter Ho
Décision correcte
Probabilité : l-a
Rejeter Ho
Décision incorrecte
Probabilité : a
P r o b a b i l i t é : 1-p
L’une des deux décisions possibles à savoir :
> rejeter HO
3 accepter HO
peut être prise alors qu’elle est fausse.
Le risque de première espèce a ou niveau de signification du test est la probabilite de rejeter
l’hypothèse nulle alors qu’elle est vraie.
Le risque de seconde espèce p est la probabilité d’accepter l’hypothèse nulle alors qu’elle est
fausse et la puissance du test est la probabilité de rejeter l’hypothèse nulle quand elle est
fausse.
Dans le cadre général du modèle linéaire, une hypothèse linéaire sur les paramètres est
équivalente à une hypothèse sur l’expression du modèle. Par exemple, nous pouvons
remarquer qu’accepter l’hypothèse H:O définie par l’exemple 2, revient à dire que le modèle
s’écrit :
Yij = /L + eij
i == 1, . . . ,I ; j = 1, . . . . J ;
et accepter l’hypothèse alternative Ho revient à dire que le modèle s’écrit :
= I-1 + Cti +
Yij
eij
!
i == 1, . . . , 1 ; j = 1, . . ., J.
I
/
Ainsi dans ce cadre générdl, dire que HO est vraie est équivalent à dire /que le modèle
s’exprime sous la forme :
:
(O)Y==X000+eo,
et dire que HI est vraie revier/t à dire que le modèle s’écrit :
Y=XO+e;
Atelier de formntion en Bio&trie. ISBA, Février 2001
- 12-

l’indice 0 introduit dans (0) indique la prise en compte de l’hypothèse HC, dans l’expression du
modèle.
Le test de l’hypothèse HO contre FI1 qui est ainsi équivalent au test du modèle (0) contre le
modèle (1) utilise la statistique de te:st :
Si -S2 n - r
U =
s2
x-
r-q ’
avec S 0 et S ’ désignant respectivement la somme des carrés des résidus pour 1e.s modèles (0)
et (l), q et r les dimensions respectkes des sous espaces vectoriels engendrés par les colonnes
de x0 et de ‘X.
On montre que la statistique U suit, lorsque Ho est vraie, une loi de Fischer F(r-q, n-r).
Considérons’ u la valeur de U donnée par les résultats de l’expérience et f(or, r-q, n-r) le
quantile de niveau a d’une loi de Fischer à r-q et n-r degrés de liberté. On décidera alors de
rejeter ou d’accepter HO en comparant la valeur u à f(a, r-q, n-r) :
> si u 12 f(a, r-q, n-r), on accepte HO ;
k si u IZ f(a, r-q, n-r), on rejette HO.
- 13-
;
. - I
-_
_
..~.
, , . ,
II.
. . - . I . _ - - - - _ . “ - _ - _ _ - I I _ _

5
L'ANALYSE DELA VARIANCE
5.1
Principes de l’analyse de la variance
La comparaison de différentes populations est un des problèmes les plus courants de la
statistique. Le but principal de l’analyse de la variante (Anova) est de comparer les moyennes
de plusieurs populations vérifiant certaines conditions à partir d’échantillons prélevés dans ces
populations.
Considérons que lors d’une expérience, nous nous intéressions à l’étude sur n unités
expérimentales, des variations d’une variable y (rendement par exemple) en fisnction d’un
facteur étudié composé de 1 modalités bien définies (variétés par exemple) ; les modalités du
facteur étudié sont affectées de manière aléatoire aux unités expérimentales.
Une telle expérience peut être modélisée par l’équation suivante :
yij = p + O$ +
avec
E i j ,
Eij - iidN(0, &, C ai=0
i= l,..., I;j=l,,.., n;;n=Cini
yij étant la valeur de la variable aléatoire y observée sur la J4m’ unité recevant le traitement i ;
p est la moyenne générale ; ai , appelé l’effet du traitement i, est l’écart entre la moyenne du
traitement i et la moyenne générale ; et Es est l’erreur résiduelle.
Afin de procéder à la comparaison des moyennes des traitements nous allons confronter, à
partir des données observées, l’hypothèse nulle HO qui consiste à affirmer qu’il n’y pas d’effet
dû aux traitements (c’est ,A dire que les traitements sont identiques) et l’hypothèse alternative
HI qui revient à dire que les traitements ne sont pas identiques.
On peut montrer qu’on obtient l’expression suivante :
Ceci montre que la variation centrée des observations est la somme de la dispersion due aus
traitements (SCM) et d’une dispersion aléatoire (SCR). Ces sommes de carrés d’écart seront
utilisés dans le test de Ho contre HI.
En effet, on montre que, si Ho est vraie, le rapport
1,‘ - :p4 /u -- 1)
SC ‘I-? I(?I -- I )
suit une loi de Fisher F(I-l, n-l).
On calcule alors la proba ilité SOU~ 110 qu’un F(I-I, n-l) dépasse la valeur- F!calculée et cette
valeur sera ensuite campa kée au seuil TX fixé.
Si cette probabilité p est/ inférieure à a, l’hypothèse Ho est rejetée : on dit alors que les
traitements sont signifïcatidement différents au seuil Q.
Si la probabilité p est supéi-ieure à ci, l’hypothèse Ho est acceptée au seuil cy..
~

5.2
Analyse de la variance à un facteur étudié
5.2.1 Anovn ri un facteur en rmdonùsntion totale
Le tableau d’analyse de la variante à un facteur en randomisation totale se presente comme
indiqué ci-dessous :
Tableau Anova à un facteur en randomisation totale
Source
Somme des
Carré
F
variation
carrés
m o y e n
.-
Traitement
S C A
C M 1
CMAKM
R
.-
Résiduelle
S C R
CMR
I
t : nombre de traitements ; n : nomb,re d’unités expérimentales
L,‘hypothèse d’égalité des traitements sera rejetée au niveau a lorsque le rapport CMAKMR
dépasse la valeur 6-1 ,n-La lue sur la table de la loi de Fisher.
Exemple : Etude de l’effet de 3 formulations fongicides sur rendement en gousses d’arachide
Pour comparer les effets de 3 formulations fongicides sur le rend’ement en gousses d’arachide.
nous disposons de 12 parcelles expérimentales et chacune des formulations e:st affectée de
manière aléatoire à 4 de ces parcellles. Il s’agit ainsi d’étudier un facteur à 3 niveaux avec un
dispositif expérimental en randomisakion totale.
Nous presentons ci-dessous les résultats de l’analyse des données réalisée avec le logiciel
Genstat 5.
***** Analysis of variante *****
Variate::
Rendement
Source of variation
d.f.
S.S.
m. s,
v.r.
F pr.
Formulat:ion
2
149447.
14123.
0.40
0.684.
Kesidual..
Y
1698300.
185700.
Total
11
1847746.
d.f = nombre de degrés de liberté ; s.s. = somme des carrés ; m s. = somme des carrés moyens
v.r. = rapport des variantes = rappo:rt des carrés moyens (F); F pr = p
L’examen du tableau d’analyse de variante permet de noter que :
F = 0.40 et PIro(F(2,9) > 0.40) = 0.684

On en déduit alors que l’hypothèse d’équivalence des formulations ne sera pas rejetée au seuil
5%, ce qui revient à dire qu’il n’y a pas d’effet significatif de la formulation fong;icide sur le
--
rendement en gousses d’arachide.
5.2.2
Anovn & un facteur dans un dispositif en blocs aléatoires complets
Un tableau d’analyse de la variante d’un plan à un facteur étudié en blocs aléatoires complets
a la présentation suivante :
i’ableau Anoyo d un facteur en blocs aléatoires complets
Source
de Degrés
F
variation
liberté
Traitement
t - 1
CMAKM
R
Bloc
r-l
CMWCM
R
Résiduelle
(t- l)(r- 1)
t : nombre de modalités du facteur étudié ; r : nombre de blocs
Le résultat du test des effets blocs ne doit être pris en compte qu’à titre indicatif. En effet.
l’essai n’a pas été réalisé pour tester l’équivalence des blocs. Mais ce test permet de vérifier si
les blocs ont été judicieusement constitués c’est à dire si le contrôle par les blocs de
l’hétérogénéité du milieu expérimental a été effkace.
Exemple : Comparaison de l’effet de 10 variétés sur le rendement du mil
II s’agit d’un essai dont l’objectif est de comparer 10 variétés de mil. Le dispositif
expérimental est en blocs aléatoires complets (3 blocs) et la variable observée est le
rendement de la culture. Les résultats de l’analyse des données sont présentés ci-aprks.
+**** Analysis of variante *****
Variate: Rendement
Source of variation
d.f.
S.S.
m.s.
v.r.
F pr.
Bloc.+Units* stratum
Varieta
Residual
Total
1 f- teqt associé a u fprterrr Variéti31 n o u s cnr~driit à afiirmèr qu’il euiste ‘dec dif‘férence~
significatives au seuil 5% entre les rendements des ditErentes variétés.
- 16-

Nous remarquerons que Genstat ne fournit pas explicitement la probabilité associée au test
d’absence d”effet bloc. Ainsi si nous nous intéressons au test de l’effet bloc, nous devrions
comparer la valeur du F correspondant à la valeur seuil donnée par une table de Fisher.
On lit sur une table de Fisher la valeur f(2;18;0.05) = 3.55 et comme 1.89 53.55, on en déduit
l’absence d’effet bloc au seuil 5%1. On peut ainsi dire que les blocs n’ont pas permis de
contrôler de manière efficace l’hétérogénéité du milieu.
5.3
Analyse de la variante à deux facteurs étudiés
Avec deux facteurs étudiés, il faut tout d’abord s’intéresser au test de l’interaction. Si.
l’interaction n’est pas significative on peut tirer des conclusions sur les effets principaux des
deux facteurs. Par contre lorsqule l’interaction est significative il ne faut pas conclure
directement. Il faut dans ce cas examiner les résultats de plus près car l’interprétation peut
devenir ,plus complexe. Une représentation graphique est souvent fort utile pour une
interprétation correcte des résultats.
Exemple
Considérons un essai dont le but est d’étudier l’effet de 2 facteurs, la variété et la dose
d’engrais, sur le rendement d’une culture. Les graphiques suivants présentent difrérents cas de
figure possibles.
Dl
D 2
D3
Figure / : Absence d ‘irlteraactim

Nous pouvons noter d’après la figure 1 que l’écart entre les 2 variétés est iddépendant de la
dose d’engrais ; ce qui revient à dire qu’il n’y a pas d’interaction entre les 2 facteurs.
-.
D’après les figures 2 et 3, on relève que les différences entre les variétés varient en fonction de
la dose d’engrais utilisée. On dit alors qu’il y a une interaction entre les 2 facteurs
Dans le cas présenté par la figure :2, l’interaction a pour effet d’amplifier les différences entre
les 2 variétés tout en conservant l’ordre des moyennes. Le test des effets dose et variété
présente alors un intérêt.
Dans le cas présenté par l#a figure 13, l’interaction a pour effet d’inverser l’ordre des moyennes
des variétés. Le test global des effets principaux des 2 facteurs perd son sens dans ce cas.
5.3. I Anova à deux facteurs en randontisation totale
Le tableau d’analyse de la variante à deux facteurs étudiés dans un plan +n randomisation
totale se présente comme indiqué ci-dessous :
Tableau Anova à 2facteurs en ram’omisafio~~ totale
F;nrrcrA variation
_
1 Degrés:; liberté
1

Carz;;yen
1
CMjICm
-1
/

Résiduelle
1

IJG:-l)
/

Cm
/
I et J respectivement nombre de modalités des facteurs A et B ; r : nombre de répétitions
Exemple : Influence de différents régimes alimentaires sur la croissance pondéfale
11 s’agit d’une expérimentation dont. le but est d’étudier l’effet de deux facteurs, le supplément
de vitamine B12 et le supplément d’antibiotique sur la croissance pondérale du porc. Chacun
des deux facteurs a 2 niveaux (supplément, pas de supplément). Chacuri des 4 régimes
alimentaires ou traitement est apporté quotidiennement à un lot de 3 animaux choisis de
manière aléatoire et le gain moyen quotidien de chaque porc est relevé à l’issue de
l’expérience. Les résultas de l’analyse de la variante sont présentés ci -après :
+**+* Analysis of variante *'++*
Variate: GMQ
Source of variation
d.t.
S . S .
m. s.
V . L .
F pr.
Antibiotique
Vitamine
Antibiotiyue.Vitamlne
Residual
Total

L’examen de ces résultats nous permet tout d’abord d’affirmer que l’interaction des 2 facteurs
étudiés est très hautement significative. L’existence d’une telle interaction signifie que
l’influence du supplément d’antibiotique est fonction du supplément de vitamine.
L’observatïon du graphique suivant permet d’avancer que la réponse au supplément
d’antibiotique est fortement marquée en présence du supplément de vitamine alors qu’elle a
même une tendance négative en son albsence.
Vitamine
+ O m g
r
+5mg
0,50 -i
0,oo l-
Of-w
40mg
Antibiotique
5.3.2
Anova à deux facteurs étudiés dans un dïspositif en blocs aléatoires complets
Un tableau d”analyse de la variante d’un plan en blocs aléatoires complets â. deux facteurs
étudiés a la présentation suivante :
Tableau Anova à 2 facteurs en blocs aléatoires complets
Degrés de liberté
Carré moyen
I-l
C M 1
J-l
CM2
~-
(1- l)(J,- 1)
;
CM1
-
-
r-l
CMB
cm3/cMR
;
(r- l)(IJ-1)
C M R
I
1 : nombre de niveaux du facteur 1 ; J : nombre de niveaux du facteur 2 ; r : nombre de blocs
Exemple : Etude de l’influence de l’application de différentes doses d’engrais azoté à des
variétés de riz, sur le rendement de la culture
11 s’agit d’un essai disposé en 3 blocs aléatoires complets dont l’objectif est de comparer
l’influence sur le rendement du riz de 5 traitements ( 4 doses d’engrais azoté et le témoin sans
engrais) appliqués à 3 variétés de riz.
Le tableau suivant présente les résultas de l’analyse de la variante réalisée sur le rendement.
Qn en déduit que l’interaction entre Ics 2 facteurs n’est pas signiGcativc. En outre, l’application
-.---
.--
_
-~-_
dtt~i.,~,. tic, i’ firlio~~ ~>II Iriiotrlétt,rt ISlLl. ‘.Yrricr 2001
- 19-

d’azote a un effet très hautement significatif sur le rendement du riz et les différenc’es entre les
rendements des variétés de riz sont significatives.
***** Analysis of variante *****
Variate:
RENDEMENT
Source of variation
d.f.
S . S .
m.s.
V.Z.
F pr.
BLOC stratum
3
2.5998
0.8666
5.73
BLOC.*Units* stratum
VARIETE
2
1.0528
0.5264
3.48
0.040
AZOTE
4
41.2347
10.3087
68.15
<.0x31
VARIETE.AZOTE
8
2.2907
0.2863
1.89
0.087
Residual
42
6.3528
0.1513
Total
59
53.5309
5.3.3 Anova ci deux facteurs dans un dispositif en salit plot
Un tableau d’analyse de la variante à deux facteurs étudiés dans un dispositif en split plot a la
présentation suivante :
Tableau Anova à 2 facteurs en split plot
I
Source de variation
Facteur 1
Bloc
Résiduelle 1
Facteur 2
Interaction
I
(WJ-1)
/
CM9
I
CMIKMR2
Résiduelle 2
/

I(J-l)(:r-1)
1
,
CMR2
1
1 : nombre de niveaux du facteur 1 ; J : nombre de niveaux du facteur 2 ; r : nombre de blocs
Exemple : Etude de l’effet de la fertilisation et de la variété sur la production du sésame
II s'agit d’un essai réalisé en vue d’étudier deux facteurs la variété (5 variétés) $t la fertilisation
(2 niveaux de fertilisation dose de fertilisation et témoin non fertilisé). Le ispositif mis en
place correspond à un split plot avec 3 blocs. La variktk est en grandes par’celles et la
fertilisation en petites Parce/lles.
d
L’examen des résultats prébentés ci--dessous nous permet de dire que Pintera
facteurs variété et fertilisa$on n’est pas significative. De plus, l’effet de la
rendement est significatif et il existe des différences très hautement
rendements moyens des 5 variétés de sésame.
- 20 -
l

***** Anal,ysis of variante *****
Variate:
RENDEMENT
Source of variation
d.f.
S.S.
m.s.
v.r.
F pr.
BLOC stratum
2
536569.
268285.
.21.14
BLOC.YZ?R rtratum
VAR
4
810515.
202629.
15.96 <.OOl
Residual
8 .
'P1541.
12693.
1.29
BLOC.VAR.TRAIT stratum
TRAIT
1
97322.
97322.
9.85
0.011
VAR.TRAIT
4
69331.
17333.
1.75
0.214
Residual
10
98769.
9877.
Total
29
1714048.
5.4
Les méthodes de compawaison des moyennes
L’analyse de la variante nous petmet de procéder au test de l’hypothèse ~d’égalité des
traitements. Lorsqu’à l’issue du test on décide de rejeter cette hypothèse, c’est à dire qu’on
déclare qu’il existe des différences significatives entre moyennes des traitements, il convient
alors de déterminer, parmi celles-ci, celles qui sont significativement différentes.
II existe différentes méthodes de comparaison des moyennes qui nous permettent de répondre
à cette question. Mais il faut noter dès à présent qu’elles ne se valent pas toutes : le choix de
l’une d’entre elles sera ef%ectué judicieusement en fonction de l’objectif expérimental poursuivi
et de la nature des traitements étudies.
Par raison de commodité,, on se limitera dans la suite au cas où les traitements sont répétés un
même nombre de fois (plan équilibré)
5.4.1
La. mithode de la plus petite différence sinnificntise
Lorsque l’hypothèse d’égalité des p traitements est rejetée, le test de Student nous permet de
tester l’égalité des moyennes de deux traitements i et i’ à l’aide de l’expression :
avec Y; et Y,, les moyennes respectives des traitements i et i’ ; 6,’ et cF;i les estimations des
variantes respectives des 2 traitements et n le nombre de répétitions
En considérant l’hypothèse d’égalité de la variante des traitements, cette expression devient :

avec ô 2 l’estimateur de la vhriance commune des traitements.
On calcule l’expression :
ppds = tl-a/2 &?-Ïk
et l’hypothèse d’égalité des 2 moyennes sera rejetée si la valeur observée de la I ifférence entre
ces moyennes est supérieure ou égale à cette quantité appelée plus pt :ite différence
significative (ppds).
Cette méthode est largement utilisée: en expérimentation agricole à cause de I I simplicité de
, I+F en œuvre. Mais, il faut noter qu’avec p traitements, il existe p(p-1)/2 c( npa.raisons de
moyennes 2 à 2 qui peuvent ainsi être réalisées et donc autant de tests Tégalité de 2
moyennes. Le risque de Ière espèce de chacun de ces tests étant égal au niveau le signification
a considéré, le risque global de Ière espèce, c’est à dire la probabilité de cons Iérer à tort au
moins une différence de moyennes comme significative peut être beaucoup plus nportant
De ce point de vue l’utilisation de ce test n’est pas toujours appropriée. Elle est Yautant moins
appropriée que le nombre de traitements étudiés devient élevé.
Exemple :
Une expérimentation est menée afin de comparer le poids de 1000 grains de 10 rlari&és de mil
dans un dispositif expérimental constitué de 3 blocs aléatoires complets. 1 analyse de la
variante a mis en évidence un effet variétal significatif au seuil de 1%. Nous iipouvons alors
procéder à la comparaison multiple des moyennes.
6 2 = 0.22 ; nombre de degrés de liberté de la résiduelle = 18 ; tld = 2.101 aw
a z= 0.05 ;
La valeur de la ppds est égale à 0.8046.
Les moyennes sont rangées ci-dessous par ordre décroissant. Les moyenne: suivies de la
même lettre ne sont pas significativement différentes.
no = 8 . 3 7
A
V.5
= 7 . 8 7
AB
V1
= 7 . 2 3
HC
v9
= ‘7.13
BC
v2
= ,7 . 1 0
BC
Vl
= 6 . 9 7
c
v4
= 6.93
<-
V8
=* 6 . 9 0
L
V 6
= 6.87
c
v3
= t; . 6 2;
n
X4.2
La méthode de Bon erroni
La méthode de 13onferroni 1 ermet de tester toutes les comparaisons 2 à 2 de moyennes des
traitements tout en contrôlar :
t le risque global de lirL. espèce a. Pour cela, chacn I des tests sera
réalisé avec un niveau de sigl, ification cx’ :
b
a’<2a/p(p-1),
p étant le nombre de traitem$nts étudiés.
Il faut souligner que cette m$hode est assez conservative si p est élevé.
I
--..._-_~
~..._,
-.
i!c'liC/ .t't, /Ol.lll(iiir:~.

La comparaison des moyennes de l’exemple précédent en utilisant la méthode de Bonferroni
nous fournit les résultats suivants :
p p d s B o n f e r r o n i = 1 . 4 8
VI0 = 8.37 A
V5
= 7.87 A B
VI
= 7.23 A B
V-3 = 7.13 A B
V2
= 7.10 A B
V7
= 6.97 A B
v4
= 6.93 A B
V8
= 6.90 A B
V6
= 6.87 B
V3
= 6.63 B
Les moyennes suivies de la même lettre ne sont pas significativement différentes.
5.4.3
La méthode de Newman et Seuls
L’amplitude d’un groupe de moyennes est définie par la plus grande différence entre 2
moyennes de ce groupe. Le principe de la méthode de Newman et Keuls repose sur la
comparaison des amplitudes des groupes de k (k i p) moyennes à la plus petite amplitude
attendue à un niveau de signification donné.
Un groupe d,e k moyennes est déclaré hétérogène, c’est à dire qu’il existe des difErences entre
les moyennes constituant ce groupe, si l’amplitude dk du groupe est supérieure ou égale à la
plus petite amplitude significative (ppas) relative à un groupe de k moyennes qui est définie
par :
ppas(k) = 411X &’ ln ,
qla étant le quantile d’ordre a de l’étendue au sens de Student.
La mise en oeuvre de cette méthode commence par la détermination de la ppa:s relative à p
moyennes et la comparaison de l’amplitude observée des p moyennes à cette valeur.
Si l’amplitud’e observée ne dépasse pas la ppas, 6n dira alors que les p moyennes ne sont pas
significativement différentes.
Lorsque l’amplitude observée est plu.~ grande que la ppas relative à p moyennes, on comparera
successivement l’amplitude des diffiirents groupes de (p-l) moyennes, (p-2) moyennes, etc
avec la ppas correspondante jusqu’à ce que l’amplitude observée d’un groupe soit inférieure a
la ppas relative à ce groupe. Les moyennes constituant ce dernier groupe sont alors déclarées
non significativement différentes.

Exemple : Comparaison des moyennes des variétés par la méthode de Newman et Keuls au
seuil 5%
-_
3
4
5
6
7
0.9'7 1.07 1.14 1.20 1.25
-_
VlO = 8.31 A
V5
= 7.87 A B
VII.
= 7.23 IB
v9
= 7.13 B
v2
= 7.10 B
v7
= 6.97 IB
V4
= 6.93 B
V8
= 6.90 B
V6
= 6.87 B
v3
= 6.63 il3
5.4.4 La méthode de Dunnet
La méthode de Dunnet est une méthode de comparaison particulière en ce sens qu’elle ne
porte que sur certaines comparaisons 2 à 2 de moyennes, la comparaison des (p-l) traitements
à un traitement témoin. L’utilisation de cette méthode suppose ainsi la presence d’un
traitement témoin (traitement de référence).
Un traitement sera déclaré significativement différent du témoin si l’écart entre la moyenne du
traitement et celle du témoin est supérieur ou égal au plus petit écart significatif défini par :
dl-dz Jn
dl-dz est une valeur lue sur la table de Dunnet.
---._-
.-I
lelic,/
,r,,, c
i{iC.
-24 -

Exemple :
La variété VlO est en fait utilisée comme variété témoin dans cet essai. Ainsi nous allons
comparer, par la méthode de Dunrnet, la moyenne du poids de 1000 grains des 9 variétés à la
moyenne de la variété témoin.
ppes au seuil de 5% = 1.13
I
-ti6 16.87 1
Nous distinguons ainsi deux groupes de variétés :
k les variétés qui sont non significativement différentes du témoin
p les variétés qui ont un poids moyen de 1000 grains significativement inférieur au
poids moyen du témoin.
5.4.5
La méthode dis contrastes
Un contraste est une combinaison linéaire des moyennes des traitements telle que la somme
des coefficients linéaires est nulle. Deux contrastes sont dits orthogonaux si la somme des
double produits des coefficients linéaires est nulle.
La méthode des contrastes permet de tester la nullité de contrastes orthogonaux définis avant
la réalisation de l’expérience. Chaque test de nullité d’un contraste correspond à une
comparaison particulière bien définie.
On peut montrer que la somme des carrés des écarts factoriels se décompose en une somme
de (p-l) sommes de carrés d’écarts correspondant à (p-l) contrastes orthogonaux. Ainsi le test
de nullit& d’un contraste revient à un test de signification de la somme des carrés des karts
correspondant.
Exemple:
On s’intéresse à la comparaison de l’effet de 2 nouveaux produits insecticides utilisés à .:
doses difFérentes sur la production du niébé. Deux autres produits serviront de référence. Neut
traitements seront ainsi étudiés dans un dispositif expérimental constitué de 4 blocs complets
équilibrés.
I,es traitements sont les suivants :
TO : Témoin absolu ; Tl : Produit FI1 à la dose 1 ; T2 : Produit Pl à la dose 2 ; 1’3 : Produit P 1
à la dose 3 ;, T4 : Produit P2 à la dose 1 ;T5 : Produit P2 à la dose 2 ; T6 : Produit P3 à la dose
; ; T7 : Produit de référence Rl ; 1‘8 : Produit de référence R2.
- - -
.--
------.---
.A il,.‘. I’r cfeJ;wmation
L’; “<‘*.. ‘:, ,._,, ISR.4, FA.rit’r II:
-25 -
. ~

1
~ _ . . ,

.
< - - - - ~ - - . - - - - - - - , - -
. - . - - _ ~ - -

. . _ . - _

c _
- - - -

. i
l r
Le tableau suivant présente le test de nullité de 9 contrastes orthogonaux.
l-0
-
MOYENNES DES
S.C.E.
-F
PROBA
C O E F I CIENTS
+
AS$OCIEE
TO Tl T2 T3 ’ 4 T5 T6 T7 T8
1467.77
1892.69
641970.63
7.33 0.0119
8
-1 -1 -1
- 1
-1 -1 -1
1693.51
2116.25
107e275.63
12.25 0.0019
0 1 1 1
- 1
-1 0 0
.1904.88
1856.13
14262.47
0.16 0.6920
0
1 1 1
1 1
-3 -3
1846.20
1866.05
7881.04
0.01 0.9223
0 0 0 0
0 0 1 -1
1811.38
1634.57
83355.35
0.95 0.3408
0
-1 2 -1
0 0 0 0
2230.40
2059.18
78 177.86
0.89 0.3567
0 0 0 0
2
-1 0’ 0
1693.70
1575.45
27966.13
0.32 0.5837
0 1 0 -1
0 0 0
0
1987.18
2131.18
41467.78
0.47 0.5046
0 0 0 0
0
-1 0 0
Le test de nullité du ler contraste correspond à la comparaison des différa n Its produits au
témoin absolu. Nous notons ainsi que les produits insecticides ont un effet ::;‘g snificatif sur la
production de graines.
Aussi, on peut affirmer que le produit P2 assure une production plus élevée ql t : le produit Pl.
Par contre, il n’y pas de dijfférence significative entre les nouveaux produits e : les produits de
référence.
5.4.6 La méthode des pojlynômes orthononaax
Lorsque les traitements sont de nature quantitative, il est plus judicieux d’étuc er l,a courbe de
réponse aux traitements. Ce problèlme ne relève pas des méthodes de compas isolas multiples
des moyennes des traitements mais de la méthode des polynômes orthogor .ux qui permet
d’ajuster une fonction polynomiale au phénomène observé. Son principe
st ‘basé sur la
détermination de contrastes orthogonaux correspondant chacun à un polyni ne (d’un certain
degré donné. La somme des écarts due aux traitements sera alors décompos
: en différentes
sommes des écarts relatives à des polynômes de degré 1, de degré 2, et et: le test de
signification de ces différentes composantes sera réalisé.
Des tables nous donnent les coefficients des polynômes orthogonaux dans le ( :a s particuher ou
les niveaux du fàcteur quantitatif sont équidistants..
Exemple :
On s’intéresse à l’étude db l’effet de la densité sur le rendement d’une \\‘.a
été de riz. Le
dispositif expérimental est1 en blocs complets randomisés (4 blocs) avec 6 ( :nsités étudiée:;
(25, SO, 75, 100, 125 kg’ha).
Nous pouvons donc tester 5 polynômes orthogonaux. II n’est toutefois p,;t‘i; nécessaire de
procéder au tc;,t UL:> diff&nts polynimc~. >;U~S wus limitoiis ici iiu test dr: igmficaiioll CL.>
:S
polynômes de degré I 3.
- 26 -

***** Analysis of variante *.lr***
Variate:
Rendement
Source ,of variation
d.f.
S.S.
m.s.
v.r.
F pr.
Bloc
3
.820401.
606800.
5.06
Densité
5
2447293.
489459.
4.08 0.01.5
Linear
1
1806750.
1806750.
15.06 0.001
Quadratic
1
362217.
362217.
3.02 O-10.3
Cubic
*
1
46851.
46851.
0.39 0.541
Deviations
2
231474.
115737.
0.96 0.40.3
Residual
15
1799314.
119954.
Total
23
6067008.
***** Tables of means *****
Variate:
Rendement
Grand mean
4885.92
Densité
25.00
50.00
75.00
125.00
150.00
100.00
5124.00 5070.25 5304.25
4847.75 4591.00 4378.25
L’examen du tableau d’analyse de la variante nous permet de dire que la densité a un effet
significatif sur le rendement en riz. De plus, l’utilisation de la méthode des polynômes
orthogonaux permet d’avancer que l’effet linéaire est significatif et que les effets quadratiques
et cubiques ne sont pas significatifs. Nous dirons que l’ajustement linéaire de la réponse du riz
a la densité est significatif L’équation linéaire suivante :
y = -6.4 x +5448.2
décrit la relation entre le rendement y et la densité x.
100
Densité (kglha)
l..---.. -.-- .- ----.-----~~-
- 27 -

5.5
Validation des hypothèses de l’analyse de la variante
NOUS avons étudié brièvement le modèle linéaire et plus particulièrement le m~&$e d’analyse
de la variance qui repose sur les hypothèses suivantes :
9 indépendance des variables al’éatoires résiduelles
9 normalité des variables aléatoires résiduelles
9 égalité de la variante des variables aléatoires résiduelles
9 absence d’interaction traitement x bloc
Pour s’assurer de la validité du modèle et ainsi de l’interprétation des résultats, il est nécessaire .
de procéder à la vérification de ces hypothèses. L’analyse des résidus permet de vérifier la
validité de ces hypothèses (analyse graphique et/ou tests d’hypothèses).
Lorsque ces hypothèses de l’analyse de la variante sont remises en cause nous devons suivant
le cas:
9 utiliser des méthodes non paramétriques
9 choisir d’autres modeles tel que le modèle linéaire généralisé
9 procéder à une transformation de variables.
Certaines transformations de variable permettent, dans le cas où l’hypothèse d’égalité de la
variante ne serait pas vérifiée, de réduire l’hétérogénéité des variantes.
Les principales transformations de Va:riable utilisées en expérimentation agricole sont :
9 La transformation logarithmique :
Cette transformation permet de stabiliser les variantes lorsqu’elles sont proportionnelles aux
carrés des moyennes. Cette situation est souvent rencontrée dans les processus de croissance
et de multiplication.
9 La transformation racine carree :
Procéder à une telle transformation permet de stabiliser les variantes dans le cas où elles
seraient proportionnelles aux moyennes. Elle est recommandée pour les variables aléatoires
possédant une distribution semblable aux distributions de Poisson. Ainsi, cette tran:sformation
s’adapte bien à des données constituées de nombres entiers pas très élevés ou à des
pourcentages provenant de rapports ayant un même dénominateur et compris exclusivement
entre 0 et 30% ou entre 70 et 100%.
9 La transformation angulaire :
Lorsque la variable aléatoire à étudier possède une distribution binomiale, 1~ ~transf’ormatiotl
arc sinus est bien justifiée. Cette transformation est surtout adaptée aux probler les relatifs aus
proportions couvrant une gamme assiez large (fractions comprises entre 0 et 1 0t pourcentages
entre 0 et 100%) et données par des rapports à dénominateur constant.

6
PUISSANCEETDI~NSI~NNEMENTDVJNEEXPEFUMENTATION
Toutes les différences de faculté des différents plans à mettre en évidence des effets de
facteurs étudiés peuvent être expliquées par le calcul de la puissance associée à chaque
comparaison. Le principe général est d’obtenir une résiduelle pour mettre en évidence l’effet
souhaité qui soit la plus faible possible, mais avec un nombre de degrés de libertés suffisant.
Ces deux démarches sont souvent antagonistes.
Cependam ces différents plans d’expérience sont imposés par des contraintes pratiques, ou
une connaissance a priori. de l’homogénéité des unités expérimentales.
6.1
Rappel : test de Fisher lors d’une analyse de variance
Si lors d’une analyse de variante on cherche à tester l’effet d’un facteur A (.nl degrés de
liberté) par rapport à la résiduelle R (n2 degrés de liberté), on effectue le rapport :
CA4 (carré moyen
a
associé au facteur A)
CM, (estimation de la var iance s2 de la population)
Si ce rapport est égal à 1, alors l’effet A est confondu avec la variabilité de la population, et
est donc déclaré non significatif.
Il faut donc calculer la probabilité que ce rapport soit égal à 1. On sait que cette variable suit
une distribution de Fisher à nl et n2 degrés de liberté.
On peut donc calculer la probabilité que le rapport étudié suive une loi de Fisher d’espérance
égale à 1.
Si la valeur du rapport des carrés moyens est inférieure à la valeur prise par la variable de
Fisher au seuil 5%, alors le rapport peut être assimilé à une variable de Fisher d’espérance 1,
et l’effet A n’est pas significatif.
0.05
;$y;& &~~n~~.~ _,.,”
E . . . . .
.:.:.$y:.:: -..-.
. . :..:.:.:. ,: .y: ::: :: ::...:.:.:.:.:..
. ..-..... >.:-
I&ure 4 : Distribution d’une variable de Fisher
Si par contre la valeur du rapport des carrés moyens est supérieure à la valeur de F au seuil
5%, alors ce n’est pas une variable de Fisher d’espérance 1 et l’effet A est significatif.
----_
--
- 29 -
_.___._-
-.-.-
<--------1-~.--
-
-v-1--1--

La figure 5 présente les valeurs de la variable de Fisher au seuil 5% pour pluskurs valeurs de
ses deux degrés de liberté.
Elle varie peu en fonction du degré de liberté du numérateur (qui est le nombr$ de niveaux du
facteur A moins l), mais plptôt en fiBnction du nombre de degrés de liberté dd dénominateur
(qui est le nombre de degrés de libertk du dénominateur).
Si par exemple la résiduelle est estimée avec 1 degré de liberté, le carré moyen associé au
facteur A devra être entre 18 et 19 fois plus grand que la variante estimée (s2).
Mettre en évidence l’effet d’un facteur si la résiduelle n’a qu’un degré de libertk est donc
impossible. Si elle en a entre 2 et 4, l’effet A peut être mis en évidence s’il e$t élevé. D’une
façon générale, il faut veiller à ce que la résiduelle ait au moins 5 degrés de libkté si l’on veut
détecter l’effet d’un facteur.
De plus, le rapport des carrés moyens doit être le plus fort possible, c’est à dire qu’il faut que
la variante estimée soit la plus faible possible, tout en lui conservant un nombre de degrés de
liberté suffisant. Cette variante peut i3tre diminuée :
> en regroupant des unités expérimentales en blocs. Si l’effet bloc existe, alors la résiduelle
sera plus faible, mais comportera d’autant moins de degrés de libertés que le nombre de
blocs sera élevé.
> en effectuant les observations avez précision : la résiduelle en sera réduite
Lors du choix d’un plan d’expérience, il faudra veiller à ce que la décomposition des degrés
de libertés (propre à chaque plan d’expérience) laisse suffkamment de degrési de liberté à la
résiduelle par rapport à laquelle doit être testé l’effet jugé intéressant par l’expérimentateur.
Plus la résiduelle (s2) est estimée avec précision, plus la puissance du test eit élevée. Il est
ainsi indiqué d’améliorer cette estimation en limitant les effets parasites qui ctontribuent à la
surestimer
(hétérogénéité
intra-unités
expérimentales,
hétérogénéité
inter-unités
expérimentales contrôlables par la constitution de blocs, erreur Systém:atique sur les
observations)

Nombre de degrés
de liberté de la
résiduelle (nz)
-2
-3
-4
-5
-a--6
-7
-8
---e--9
--.-._. ]()
- 12
---- (4
--_-_ 16
18
~ 20
0 C-b
--f.--.-.-.-.
/

[

-,
1
2
3
4
5
6
Nombre de degrés de liberté du numérateur (nl)
Figure 5 : Valeurs prises par une variable de Fisher à nl et n2 degrés de liberté, avec une
probabilité p=O,O5
6.2
Caicul de la puissance d’une expérimentation
6.2.1.1 Calcul du nombre de répétitions d’un même traitement
On cherche à mettre en évidence une différence entre deux traitements A et B. II riSpétitions de
chaque traitement sont effectuées.

On désigne par Ai la valeur de la variable analysée pour l’unité expérimentale à I.aquelle on a
appliqué le traitement A et qui en est la ième répétition.
On dispose à l’issue de l’expérience de n mesures de la différence d entre ces deux
traitements:
d; = Ai - Bi
La variable aléatoire d suit une loi normale. Son espérance est A, la différence ré:elle entre A
et B. Son écart-type sd ne Peut être qu’estimé à partir de n observations. d suit donc une loi de
Student d’espérance A et d’écart-type sd.
La &iable e définie par l’expression :
d
e=--
‘d
suit une loi de Student d’espérance A/sd et d’écart-type égal à 1.
Si A=0 (hypothèse nulle Ho), alors e suit une loi de Student t(O,l). L’expérimentateur fixe 01.
risque de première espèce, qui est la probabilité de rejeter l’hypothèse nulle si elle est vraie.
On a alors :
p(lel < t,+) = 1 -a
Sous l’hypothèse Ho, si la différence réelle entre les deux moyennes était A, alors e suivrait
une loi de Student t(A/sd;l).La probabilité de conclure à une différence nulle (accepter HC,)
alors que cette différence existe est le risque de deuxième espèce. Graphiquement,
est la
surface comprise sous la courbe de: distribution de e dans le cas A#O, limitée par la valeur de
t, de l’hypothèse nulle. (voir figure n”6)
p(lel < t,.,d = 1-P
Figure 6
- 32 -

On constate graphiquement que :
t1-s: + L, = ;
sd est l’écart-type de la différence entre les moyennes des deux traitements. Si lia variante de
la population est estimée à s2, et si les observations sur les traitements sont indépendantes,
alors
Var(A)=Var(A-3) = Var :$Ai +i$Bi
1-I
I-1
On peut donc déterminer le nombre de répétitions de chaque traitement par :
n = 2-(i)2 J& +yJ
-.
n : effectif de chaque traitement (si tous les traitements ont le même effectif).
- - s2 : variante estimée du matériel expérimental
- -
A : différence entre les moyennes de deux traitements.
..~
t1-g : variable de Student dont le nombre de degrés de liberté est celui de la résiduelle par
rapport à laquelle est testé l’effet du facteur étudié, au seuil a. (test bilatéral).
-. a : risque de première espèce.
-
: risque de deuxième espèce. (1.. ) est la puissance du test,
Si les traitements ne comportent pas le même nombre de répétitions, la démarche est
analogue, et il faut simplement modifier le calcul de Var(A):
Var(A) = Var(x - Ë$ =
6: Ai + $2 Bi
2 i-l
6.2.1.2 Utilisation du calcul du nombre de répétitions
Les quantités s et A peuvent être exprimées en valeurs relatives, c’est-à-dire en pourcentage
de la moyenne :
CV(%) = _s_.lOO
X
A(%) = $00
Si la résiduelle comporte plus de 30 degrés de liberté, on peut alors remplacer l#a variable de
Student par une variable qui suit une loi Normale N(O, 1).
-33 -

L’expérimentateur dispose donc d’une loi à 5 paramètres, qui lui permet d’en déterminer un
dès lors que les quatre autres sont connus :
Mais le plan de l’expérience doit être déjà fixé, car le calcul fait intervenir le nombre de
degrés de liberté de la résiduelle. Il e:st donc aisé, quand n et 3 autres paramètres somt fixés, de
déterminer le quatrième.
Ce calcul devient complexe quand il s’agit de déterminer le nombre de répétitions de chaque
traitement. De ce nombre dépend en effet le nombre de degrés de libertés de la résiduelle, qui
sert à calculer les valeurs des variables de Student. Le nombre n apparaît donc trois fois et il
est impossible de l’isoler.
En première approximation, on peut donc approcher la loi de Student par une loi normale, ce
qui permet de déterminer un ordre de grandeur pour n, puis ensuite affiner ce résultat en
reprenant la calcul avec des variables de Student (de degré de liberté égal aux nombre de
degrés de liberté de la résiduelle).
Si l’on choisit a=O,OS et =O, 10, alors on peut obtenir une première approximation de n par :
2
n=21. -5
0A
6.2.1.3 Exemple
Un expérimentateur désire mettre en évidence une différence de rendement entre deux
variétés. Il estime le coefficient de variation, d’après des études antérieures dans des
conditions analogues, à 5%. Son plan est un plan en randomisation totale. En choisissant
a=0 05 et =O, 10, il veut connaître le nombre de répétitions nécessaire pour mettre en
évidence une différence de 10%.
Une première approximation de n est :
n est un entier donc une première approximation de n est n - 5
Un plan en randomisation totale à 5 répétitions de chacun des deux traitements lakse 8 degrés
de liberté à la résiduelle.
Les valeurs suivantes sont extraites de la table dé la loi de student :
t , -cg -
- -7-
7 306, 1, ,, = 1,397
Ainsi :
Une deuxième approximation de n est donc n = 7. Avec 7 répétitions par traitement, la
variance résiduelle est estimée avec 12 degrés de liberté.
On a alors :
t
= 2,179, t, li = 1,356
l--Y.

d’où :
n = 2@z-(t,~~ +t,$ = 2.(:o)2.(?,17~+l,356)2
= 6,25
Une troisième approximation de n est donc n = 6. Avec 6 répétitions par traitement, la
variante résiduelle est estimée avec 10 degrés de liberté.
On a alors :
t,+ = 2,228, t,+ = 1,372
d’où :
La valeur de n est donc comprise en 6 et 7. On peut donc pour plus de sécurité choisir de
répéter 7 fois chaque traitement.
6.2.2
Puissance d’une analvse de variante à un facteur comportant plusieurs niveaux
On considère ici une expérimentaIion qui vise à mettre en évidence l’effet d’un facteur
comportant p niveaux. Chaque traitement est répété n fois.
Le modèle d’analyse de variante s’écrit :
E(X,) = v+aa;
6.2.2.1 Hypothèse nulle et hypothèse alternative
L’hypothèse testée lors de l’analyse de variante est l’hypothèse nulle, qui considère que
l’effet du facteur est nul.
Ho :Vi E {l;...;p},
a, = 0
Dans le cas d’un facteur à deux niveaux, rejeter l’hypothèse nulle revient à affirmer :
A:a, f a2
Mais dans le cas d’un facteur à plusieurs niveaux, plusieurs hypothèses alternatives sont
possibles :
A , : a , fa? =a3 =CI, = a , ( u n traitement diffé rent des autres)
A,: a, = a, f a, = cc, = a, (deux groupes de traitements)
A,: a, f a3 = a3 = a, 3~ a,
(un traitement plus faible et un plus fort)
II y a plusieurs hypothèses alternatives, donc plusieurs degrés de fausseté de l’hypothèse
nulle.
6.2.2.2 étermination du degré de fausseté de l’hypothèse nulle
On introduit une estimation du degré de fausseté de l’hypothèse nulle, écart-type des effets
principaux ai par rapport à leur moyenne 0.
-35 -

d1 p
sa= -
a;
c
P i=l
Cette variable est une donnée d’entrée. Elle doit être calculée. Il est difficile de connaître a
priori les valeurs des effets des niveaux du facteur étudié. Il est possible de considérer 4
situations, qui sont les plus fréquemment rencontrées :
1. Les p moyennes se répartissent en deux groupes d’effectifs égaux (si p est pair) ou presque
égaux (si p est impair), c’est-à-dire pour n=5 par exemple :
m, = m, > m3 = m4 = ms
avec :
0
?
m,-m,=6
2. Toutes les moyennes sauf n.me sont supposées égales, ce qui donne par exemple pour p=S :
m, > m2 = m3 = m4 = m5
avec :
?
?
m, - m, = 6
3. Les moyennes sont réparties uniformément entre les deux valeurs extrêmes, c’est-à-dire par
exemple, toujours pour p=5 :
m, > m, > m, > m, > m5
avec :
m,-m,=m,-m,=m,-m,=m,-in,=- 4
4. Toutes les moyennes sauf deux sont égales, les deux moyennes isolées étant supposées
équidistantes du groupe central, ce qui donne par exemple :
m, > m7 = mj = m, > m5
avec :
m, - m, = 171~ - m, = -2
Connaître la distribution attendue des moyennes permet de déterminer k,
I’exprssion :
- 36 -
~

Le tableau no1 précise les valeurs de k pour plusieurs valeurs de p et pour les quatre
distributions de moyennes précédentes.
-
-
Distribution des moyennes
P
1
2
3
4 -
-
2
0,500
0,500
0 , 5 0 0
3
0,47 1
0,47 1
0,408
0 , 4 0 8
4
0,500
0,433
0,373
0,3 54
5
0,490
0,400
0 , 3 5 4
0,3 16
6
0,500
0,373
0 , 3 4 2 ’
0 , 2 8 9
7
0,495
0,350
0,333
0,267
8
0,500
0,33 1
0 , 3 2 7
0 , 2 5 0
9
0,497
0,3 14
0,323
0 , 2 3 6
1 0
0,500
0,300
0 , 3 1 9
0 , 2 2 4
&%Jeurs de k, rapport de l’écart-type des moyennes à l’amplitude de leur différence
-E-
6.2.2.3 Calcul de la puissance d’une comparaison de plusieurs niveaux d’un facteur
Une série d’abaques a été mise au point (Pearson et Hartley, 195 1) (voir annexe) qui permet
l’utilisation d’une fonction reliant :
- ~1, nombre de degrés de liberté associés à la SCE pour le facteur étudié (ici p-l),
- ~2, nombre de degrés de liberté d.e la résiduelle qui teste l’effet du facteur,
- a, risque de lèrzespèce,
- l- , puissance de la comparaison,
- QD, paramètre de non-centralité.
Ca peut être déterminé de la façon suivante :
@= kJ&
CJ
Comme pour les facteurs comportant deux niveaux ($3. l), il est tout à fait possible de
déterminer par exemple le nombre de répétitions d’un traitement pour attendre un objectif
fixé, ou de calculer la puissance d’un expérience déjà conçue.
6.2.3
Puissance d’une nnd~se de wriance 2 plusieurs facteurs comportant plusieurs
niveaux
Dans le cas d’un modèle croisé fixe, l’utilisation des abaques est toujours possible. mais ii
faut considérer le nombre total de répétitions de chaque traitement.
Si p niveaux d’un facteur A et q niveaux d’un facteur B sont étudiés, alors le calcul de @ pour
les niveaux du facteur A se fera par :
~ = k.S.6
0

6.3
Conclusion : démarche de choix d’un dispositif expérimental et
dimensionnement de l’essai

Objectifs expérimentaux :
Gradients
Contraintes
- nb facteurs.
d’hétérogénéité
pratiques et
- nb niveaux
r-l
du champ
El
financières
- effets simples
) des traitements ]
d’expérience
- intercations
Choix d’un type de plan d’expérience
Analyse préliminaire qualitative
Déconzposition a priori des SC’E en degrés de 1ihertC
S C E ,
3.b I l - 1
SCE ss-bloc
a.,,- I
SCE,
a- 1
X E , , ,
Il- 1
Rés. 1
(a-I)(n-1:i
XE,
b-l
XE,,
(a- 1 )(b- 1;
I
Ris.2
a(n-l)(b-i)
(Split-plot;
Les objectifs qualitatifs sont-ils atteints ?
(un effet ne peut être testé que par rapport ,7
FI)
,J
une résiduelle d’au moins 5 Ddl‘)
---J 1 dispositif 1
d’expérience
I
I

Analyse quantitative : données d’entrée
I
pas déceler l’effet d’un facteur : p
I et de
I
kr-
I puissance I C:>l Risque de conclure à un effet qui n’existe pas : (Y1
-
“1
-
-
Objectifs
Valeur de la différence à mettre en hidence
quantitatifs
(absolue ou relative) : A
et intuitions
de l’expéri-

Structure des effets des niveaux d’un facteur :
mentateur
o-o-o-o-o ou o--o--o ou
F Nombre de répétitions d’un même traitement : IZ
I
I
1
1
Etude
Variante ou coefficient de variation du matrériel
biblio-
espérimental pour le facteur considéré : s2 / C’\\’
graphique
(dans des conditions analogues)
c
1
I
I
ispositif
expéri-
1c= Nombre de dégrés de liberté de In résiduelle qui
b
mental
1teste l’effet du facteur considéré: n2
I
l 1
1
1 1 Détermination d’une variable à partir des, 4 autres /
(pour un facteur h deux nil.eaux par exemple)
- 40 -

I
1
Exemple de diagnostic : II trop élevé
Diminuer s2 la variante
Augmmenter n2, le
résiduelle par une observation
nombre de degrés de
appliquée des variables étudiées
liberté de la résiduelle
et une élimination des effets
par un changement de
parasites qui tendent à la.
dispositif expérimental
surestimer (distinguer des blocs
(efficace surtout si
ou augmenter le nombre de blocs)
celui-ci est inférieur à 8)
Augmenter Ay c-à-d
Augmenter a,
n’espérer de l’essai
c-à-d accepter
Diminuer l-p, la
que la mise en
un risque plus
puissance. c-à-d
évidence de
Ll
élevé de
diminuer la
différences plus
conclusion
probabilité de mettre
importantes
positive fausse
en evidence l’effet du
facteur considéré
Dernière étape : préparer les observations
tirage aléatoire des individus sur lesquels seront effectuées les mesures
l
0 1 Préparation des fichiers de recueil et de traitement des données
I

7
LES REGROUPEMENTS D’ESSAIS
(D’après Philippe Letourmy, Cirad, 1992)
7.1
Introduction
La caractéristique essentielle d’un essai est de créer des conditions contrôlées. En effet: pour
comparer des traitements, iI faut qu’ils soient comparables, donc il faut se rapprocher de
l’idéal : “toutes choses sont égales par ailleurs”.
La conséquence est qu’un résultat d’essai est relatif à une situation particulière : ce.Ile créée par
les conditions de l’expérience (par exemple, le précédent, les techniques culturales. les
conditions climatiques, etc.).
Mais le problème est de passer d’un résultat de recherche (analytique) à une innovation
vulgarisable en milieu paysan, dans une région qui peut être étendue. Il est assez naturel de
multiplier le même essai dans des conditions fort diverses, et de voir si l’on a ou non le même
résultat. On pratique ce que l’on alppelle des essais multilocaux ou pluriannuelc. Par essais
pluriannuels, on entend des essais de même protocole expérimental, réalisés lors d’années
différentes, à des emplacements différents et avec des randomisations indépendantes. Ceci
exclut les essais pérennisés, c’est ii dire conduits pendant plusieurs années sur les mêmes
parcelles avec les mêmes traitements. L’analyse statistique des différentes unités d’un essai
pérennisé relève de la méthodologie des mesures répétées et non de celle des regroupements
d’essais.
7.2
Effets aléatoires - effets fixes
A un essai correspond l’ensmemble de ses conditions de réalisation. Cet ensemble de conditions
est appelé la situation de l’essai. Dans un regroupement d’essais, on cherche à obtenir une
réponse des écarts entre traitements à des situations très diverses. Ceci revient à étudie1
l’interaction traitement*essai. Mais deus options sont possibles.
7.2.1 Effets nléntoires
On peut considérer que les essais regroupés forment un échantillon représentatif d’un vaste
champ d’application (par exemple une région). Ils sont alors le résultat d’un tirage aléatoire
dans un ensemble de situations, et on considère l’effet essai et l’interaction traitement-essai
comme des effets aléatoires. L’objectif est ici de tester les écarts moyens entre traitements SUI
l’ensemble des situations par rapport à une base de référence qui est l’interaction traitement-
essai. On parle de r&zionalisation de la réponse.
L’hypothèse qui facilite les calculs dans ce cas est de considérer que les moyennes des
traitements dans chaque essai sont. estimées avec la même précision. Donc, on suppose
l’égalité des variantes résiduelles d,ivisées par le nombre de répétitions par traitement. C’est
l’option qui est prise par le logiciel STATITCF pour faire l’analyse ~d,e variante du
regroupement.
7.2.2 Effefs fhes
!.‘?litre option est dc con.\\r;Jél-ty qtle les t’:saic ~-vQI.I~A~ former?! L!~T <~ri~c~~~l7 ) le C!C situatiorq
ayant certaines caractéristiques (géographiques, pédologiques, culturales, et+. ). On suppose
alors que les résultats peuvent être ~(Gnéralisés aux situations avant Desh caractéristiques
_,
proches. L’eKet essai et l’inter-acti.on traitement-essai sont pris comme des effets fixe5
- -. -.- ------._-_
~.--
.~ --.-- ~ ..__
-..---A-.------
< 8 : <C’.$~
7, ,’
‘:I t ;,‘y<..c ~ ,f -;
. ’
>
- 42 -

L’objectif est d’étudier l’interaction en tant que telle, en essayant de trouver les solutions
adaptées à chaque situation. Tous les tests doivent alors être faits en prenant comme base de
référence la variante résiduelle des essais. On parle de structuration de l’interaction (au sens
large).
L’hypothèse habituellement faite dans ce cas (sauf par STATITCF) est de considérer que les
données parcellaires sont obtenues avec la même précision. Donc on suppose l’égalité des
variantes résiduelles. Cette hypothèse n’est identique à la précédente que si le nombre de
répétitions par traitement est constant.
On peut remarquer que le test de l’interaction traitement-essai la plus générale nécessite de
-faire des répétitions cId~~s chaque essai.
7.3
Conditions de réalisation des essais multilocaux
Les séries d’essais peuvent être réalisées en milieu contrôlé : les essais se déroulent en station
ou sur points d’observation, leur mise en place et leur suivi sont assurés ou contrôlés par les
chercheurs. Ou bien elles peuvent être réalisées en milieu paysan (ou milieu réel, ou milieu
semicontrôlé) : en général le chercheur assure ou contrôle la mise en place, l’application des
traitements et les observations (dont la pesée de la récolte) ; le paysan assure le reste, à savoir
la conduite de la culture selon ses propres techniques.
La justification essentielle des essais en milieu paysan est que la station, et plus généralement
le milieu contrôlé, ne peut simuler ni toutes les contraintes ni tous les desiderata des paysans.
Or ils peuvent s’exprimer dans des essais en milieu paysan.
Les essais que l’on prévoit de regrouper doivent avoir le même protocole, avec entre autres :
> les mêmes traitements (au minimum la plupart des traitements en commun),
k le même type de dispositif (randomisation totale, blocs complets, ou autres; tout en
sachant que les regroupements de split-plots ou de criss-cross posent des probkmes
avec STATITCF),
k la même surface parcellaire,
> si possible le même nombre de répétitions,
k mais des randomisations indépendantes
7.4
Analvse des séries d’essais
La procédure d’analyse se fait en trois étapes, avec des variantes selon l’option prise
7.4.1 Etripe 1 : nnnlyse des essais individuels
On procède à l’analyse de variante de chaque essai individuellement, et on isole les \\,ariances
résiduelles (carré moyen résiduel ou Mean Square Error).
7.4.2
Etupe 2 : sélection des essais de tnêtrl~e wrimce résiduelle
Il s’agit de sélectionner des essais de même variante résiduelle ou bien de même rapport
variante résiduelle sur nombre de répétitions selon ce qui est choisi. Si les nombres de de@
de liberté pour estimer les variantes résiduelles sont identiques, on peut appliquer le test de
HARTLEY (facile à faire):
-43 -
_..

._--
I*lllllllll-c-“‘.w---m’
-.
.._m--_-__“--__-

-,_,

a.
.
. .
._
,.
,.
.<..,,
Sinon le test de BARTLETT (plus puissant, mais plus lourd à calculer) peut être appliqué. Ces
deux tests ne sont pas programmés sur STATITCF et doivent être faits h la main ou
programmés spécifiquement pour cela.
Une macro rédigée sur Excel est disponible pour effectuer le test de Bartlett.
Si les variantes résiduelles (resp. les rapports variante sur nombre de répétitions) ne sont pas
égales, le plus fréquent est de constituer des groupes d’essais de même précision en écartant
les essais à trop forte variante résiduelle (resp. rapport variante sur nombre de répétitions).
Z 4.3 Etape 3 : nnnlvse de snrinnce du rewoupenzent.
L’analyse différera selon l’loption woisie (effets fixes ou aléatoires)
7.4.3.1 l’effet essai et l’interaction traitement-essai sont supposés aléatoires
Si les essais regroupés sont des plans en blocs complets, l’analyse statistique est réalisée au
moyen du modèle
Y,k = CL + Ai + j + (7, -t Dik + Eijk
o ù
Y,k est la donnée observée dans l’essai i, sur le bloc k et pour le traitement j.
p est la moyenne générale,
Ai est l’effet aléatoire de l’essai i,
j est l’effet du traitement j,
Cij est l’interaction essai i, traitement j (aléatoire),
Dik est l’effet bloc k de l’essai i (aléatoire),
Eijk est l’erreur résiduelle dans l’essai i. sur le bloc. k, pour le traitement j (de val-iance II,
Soit Iii le nombre de répétitions dans l’essai i, 1 le nombre d’essais. t le nombre de traitements
On définit :
tl(j = Cini
Y;.. = Xj Yii./t
Y<),j. = Zi Yij./l (estime Cl + ;)
Yo.. = Cij Yij./tI (estime jJ)
z410rs le tableau d’analyse de variante s’écrit

La résiduelle est appelée aussi résiduelle pondérée. On teste l’interaction par rapport à cette
résiduelle pondérée et l’effet traitement par rapport à l’interaction traitement-essai. D’où un
classement global des traitements. .’
7.4.3.2 l’effet essai et l’interaction traitement-essai sont supposés fixes
Si l’effet essai et l’inter’action traitement-essai sont supposés fixes (étude de I?nteraction en
tant que telle), et si les essais regroupés sont des plans en blocs complets, l’analyse statistique
est réalisée au moyen du modèle
t
Yijk=pfai+ j+(a)ij+&+&ijk
- ..__._ . ..__ --. _.

.~
Yckest la donnée observée dans l’essai i, sur le bloc k et pour le traitement j,
p est la moyenne générale, ‘
1
ai est l’effet de l’essai i,
. est l’effet du traitement j,
J
(a )i~ est l’interaction essai i, traitement j,
6k est l’effet bloc k de l’essai i,
Eijk est l’erreur résiduelle (de variante a”).
Le tableau d’analyse de variante s’écrit
l Variation
I
SCE
dl
CM
----r
FT
T r a i t e m e n t
Ci IlO (Y.j. -- Y...)”
t-l
SCT/(t- 1)
Essai
Ci t ni (Yi.. -Y...)”
I-l
S&/(I-1)
Interaction t*e
C;i ni (Yij. - Yi.. - Y
-.. : +

Y
^... \\2
(t-11 (I-11
SClXt-11 (I-11
, \\~ ~,\\~~, , ---,--,,--,
- ---.
Bloc
&c t (Yi.k - _ ~..,
Y:..>2
I
Ill-l-1
SCB/fnw1)
t
&B/Cti
I
résiduelle
cijk (Yijk - Yi.k - Y~J. + Yi..)”
1 (t-1 ij(no-1) 1 SCR/(t-$o-r)fl
-
7
Tout doit alors être testé par rapport à la variante résiduelle, car tous les effets sont fixes.
La première chose à voir dans ce tableau est le test de l’interaction traitement-essai. Si cette
interaction est significative, l’analyse se poursuit pour essayer de la décrire ou de l’expliquer
(structuration de l’interaction : au sens large).
Le logiciel STATITCF propose diverses méthodes d’études de l’interaction, mais en supposant
que les erreurs résiduelles &;jk sont de variante ni o2 (au lieu de 02). Ceci revient à supposer
que les moyennes par traitement et par essai ont la même précision dans tous les essais. Cette
hypothèse est identique à celle du modèle ci-dessus si le nombre, de répétitions est le même
dans tous les essais.
II existe un grand nombre de méthodes d’étude de l’interaction. On va passer en revue un
certain nombre d’entre elles en considérant trois types de problèmes :
1
On cherche à constituer des groupes d’essais homogènes. On peut utiliser
-
des méthodes graphiques simples si le nombre d’essais est faible
-45 -
-.
.-. .--
-_.I--
-----,-,--
---

.-

-p,..
-II---m.-L--
- S

i
-
une analyse en composantes principales (ACP) non normée sur le tableau des
interactions (essais en individus, traitements en variables, et à la croisée d’un
I
individu i et d’une variable j la valeur de l’interaction Yij. - Yi.. - Y.j. +- Y...
-
ou une classification automatique sur le même tableau.
.
2
On cherche à constituer simultanément des groupes d’essais et des groupes de
traitements. On peut utiliser :
_- la structuration visuelle (matrice de BERTIN),
- la méthode de CARALJX,, qui est une manière automatique de faire la structuration
ci-dessus,
- la classification automatique sur les lignes (essais) et sur les colonnes (traitements).
- Il faut noter que ces trois options sont proposées par STATITCF dans le module
“structuration de l’interaction” (au sens strict).
3
On cherche à modéliser l’interaction. on peut utiliser
.-
la régression factorielle qui consiste à prendre en compte des covariables
explicatives des essais et/ou des traitements,
- la régression conjointe ou modèle d’étude de la stabilité du rendement dans les essais
variétaux. Ceci consiste à prendre comme covariable la moyenne par essai des
variétés communes à tous les essais.
La régression factorielle est disponible sur STATTTCF, contrairement à la régression
conjointe.
7.5
Etude d’un exemple
Amendements phosphorks du niébé, région de Manaus, Brésil, 1990 (J. Russe.1)
Quatre traitements sont comparés dans 4 environnements :
engrais organique urbain traité
Chaque essai est un dispositif complètement randomisé, comprenant trois répétitions
L’objectif de l’essai est de déterminer le meilleur traitement à appliquer dans la région. II
s’agit d’une problématique de régionalisation de réponse. L’effet environnement et
l’interaction traitement-environnement sont donc des effets aléatoires.
7.5.1 Etape 1 : nnnly& des essais individuels
Analyse de variante (site 11~2) (statitct)
Variation
Var.totale
Var.facteur 1
Var.residuelle 1

On procède de même pour les autres environnements, et l’on obtient le tableau de variantes
résiduelles suivant :
Environnement
Variante résiduelle
Ddl
1
0.03
8
2
0 . 0 2
8
3
0 . 0 2
8
4
0.01
8
._______ -_- -_._..___ __ -
--_
7.5.2 Etape 2 : sélection des essais de même variance rkkiduelle
Site
1 Var. res.
0,03
Ddl
8
2 Var. res.
0,02
Ddl
S
3 Var. res.
Ddl
8
4 Var. res.
0,Ol
Ddl
8
---
Chi’ th
7,s
Chi2 Bartlett (observé)
22
Le Chi2 Bartlett (calculé à partir de 13 macro Excel) est in&ieur au Chi2 théorique. Les
variantes peuvent donc être considérées comme homogènes et les quatre essais pourront être
utilisés dans le regroupement.
Pour pouvoir conduire cette analyse sous STATICF, il faut, à la fin de l’analyse de variante,
choisir l’option « conserver les moyennes pour un regroupement », et enregistrer un fichier de
moyennes pour chaque essai.

7.5.3 Etape 3 : analvse de variante du rem-oupement
Le module « regroupement d’essais » de STATICF permet de construire le. fichier de
moyennes à partir des fichiers individuels sauvegardés précédemment. On obtient alors
l’analyse de variante suivante :
-~
Source de variation
S.c.e Ddl
Carres
Test f
moyens
Rap.cm F talc D d l f
Proba
A : totale
8,90
1.5
0,59
B : facteur 2
5,26
3
1,75
C : facteur 1
2,67
3
0,89
C/d
8,27
319
0,0062
D : inter f2*fl
0,97
9
0,ll
D/e
4,77
9132
0.0005
E : résiduelle pondérée
32
0 . 0 2
Facteur 1 : Phos
Facteur 2 : Env
L’interaction Phos*Env est significative. La réponse ne peut donc pas être régionalisée. Il faut
donc étudier l’interaction plus profondément pour pouvoir conclure.
Sous Genstat on peut utiliser le module REML, qui permet d’analyser des moclèles mixtes
(combinant effets fixes aléatoires et fixes). Dans cet exemple, il suffit de déclarer le facteur
« Phos )) comme effet fixe, et les facteurs « Site » et « Bloc » comme effets aléatoires.
Le facteur « Bloc » est inclus dans le facteur « Site », c’est à dire par exemple que le bloc 1 du
site i n’a aucun lien avec avec le bloc 1 d’un autre site. Le facteur « Bloc » n’a de sens qu’au
sein du site. C’est donc l’interaction Site*Bloc qu’il faut étudier. On parle d’« effets inclus ))
(en anglais « nested effects »). Il convient alors de déclarer les effets aléatoires comme suit :
SITEBLOC (Bloc inclus dans Site)
Genstat propose alors la valeur de la statistique de Wald, qui teste l’effet fixe. Son degré de
significativité se teste par un test de Chi*, par la commande suivante (dans le cas d’une
statistique de Wald d’une valeur de 69.8, à 3 degrés de liberté) :
talc str= 1 -chisq(69.S;3)
print .str
On conlut à un effet fixe significatif si la probabilité associée est inférieure au risque de
première espèce (cx).

8
L'ANALYSED'ADAPTABILITE:UNEMETHODEPOURLAMISE
AUPOINTETL'ANALYSEDESESSAISENMILIEUREEL
(D’après John T. Russel, 1996)
8 . 1 Obiectifs:
L’objectif de l’analyse d’adaptabilité est de déterminer le domaine d’adaptation de
recommandations agronomiques.
Elle permet d’exploiter les données recueillies dans un dispositif en blo’cs ‘L .,ersés, qui ne
permet pas d’isoler l’effet site du fait de l’absence de répétitions intra-sites.
Elle permet également d’interpréter un regroupement d’essais dans lequel apparaît
significativement une interaction traitement*environnement. La réponse ne peut alors être
régionalisée, et une étude de l’interaction est alors nécessaire.
8.2
Données nécessaires :
Les données nécessaires à l’analyse d’adaptabilité sont de deux types :
Des données analytiques, recueillies dans un dispositif qui peut être une série d’essais ou des
blocs dispersés multilocaux et/ou multiannuels. Ces données doivent être le résultat de la
comparaison d’objets, c,‘est à dire être issues d’essais factoriels. Dans l’étu’de, le terme
« environnement » est utilisé. Il désigne aussi bien un site, une année, ou un bloc isolé.
Des données de caractérisation des environnements, permettant de décrire il partir
d’informations qualitatives ou quantitatives les spécificités de chaque localisation d’essai.
8.3
Conduite de l’analyse environnementale :
Il s’agit d’une série d’étapes, qui font intervenir
des méthodes graphiques intuitives, qui exigent la maîtrise de logiciels du type tableur
des méthodes statistiques, pour valider les conclusions des analyses graphiques
En aucun cas il ne faut s’arrêter aux techniques graphiques, celles-ci faisant intervenir des
méthodes biaisées. Les procédures statistiques. permettent de valider les regroupements qui
ont été pressentis dans l’analyse graphique.

Les étapes sont présentées succinctement, à titre de synthèse. Il est en effet plus aisé de suivre
l’analyse à partir d’un exemple.
8.3.1
Calculer une mesure de Ier performance de chaque environnement :
L’indice environnemental permet d’évaluer le potentiel de l’environnement considéré. 11 est
calculé à partir de la moyenne de la performance de tous les traitements clans un
environnement donné.
8.3.2
Estimer et modéliser In réponse des traitements ci l’environnement
A partir d’un graphique présentant en ordonnant la variable étudiée pour un traitement donnk
et en abscisse l’indice environnemental (TE), un ajustement linéaire ou non linéaire pemiet de
modéliser la réponse des traitements à 1’IE.

8.3.3
Définir des domaines de réponse équivalente des traitements ri 1 ‘environnement
s-
La synthèse sur un même graphique des modèles de réponse de tous les traitements permet de
définir graphiquement des zones où les mêmes recommandations sembient s’appliquer. Ces
zones, où le classement des traitement est le même, doivent comporter plusieurs
c.,
environnements. Elles sont ci-après dénommées « domaines ».
8.3.4
Valider la constitution des domaines
Un domaine regroupe plusieurs environneemnts. Chacun de ces environnements est C#onsidéré
comme un bloc. Pour mener une analyse de variante au sein de ce domaine, il faut s’assurer
de l’homogénéité des blocs. Ceci
1: intervenir un test de Bartlett sur les variance:s de chaque
bloc. On calcule donc la variante de chaque bloc, et on compare ces variantes entre elles.
Si les variantes sont homogènes, alors on peut passer à l’ktape suivante. Sinon il faut revoir la
constitution des domaines, en excluant au besoin des blocs qui introduisent une dMérence de
variante trop importante.
8.3.5 Mener une analvse de variante par domaine
L’étape précédente a permis de s’assurer qu’une analyse de variante par domaine était
possible. Celle-ci doit mettre en évidence que l’interaction environnement*traitement n’est
pas significative. Les conclusions au sein du domaine considéré s’appliquent à tous les
environnements du domaine. Celui-ci est homogène. Si l’interaction est significative, alors il
faut revoir la constitution des domaines.
8.3.6
Effectuer une anova sur le regroupement des domaines
A partir des analyses de variante individuelles de chaque domaine, un regroupement d’essais
permet de s’assurer de l’indépendance des recommandations de chaque domaine. Si
l’interaction domaine*traitement est significative, alors l’effet du traitemerrt n’est pas
généralisable à tous les domaines, ce qui justifie leur constitution.
X3.7 Formuler des recommandations indépendantes dans chaque domaine
A partir des classements de moyennes obtenus par les analyses de variante individuelles de
chaque domaine, on peut identifier les recommandations propres à chaque domaine.
X3.8
Expliquer l’indice environnemental par des variables caractéristiques du milieu
Cette étape est parmi les plus délicates. Elle détermine l’applicabilité des conclusions de
l’analyse.
II s’agit de tenter d’expliquer les différences entre sites, mesurées par I’lE, par les variables
caractéristiques du milieu relevées dans chaque site. Cette ktape peut faire intervemr
des méthodes de régression simple (modélisation de I’IE par des variables du milieu),
des méthodes de régression multiple (modélisation de I’IE par une sommet de iwiables du
milieu, celles-ci pouvant être sélectionnées automatiquement à partir d’une ptocédure du typt‘
(( stepwise B),
des méthodes multivariées (ACP pour identifier les variables qui représenltent le mieux la
variation tuialc: des .;,,b)
- 50 -

8.3.9 formuler les recommandations en termes de caractéristiques du milieu
L’étape précédente a permis de caractériser les environnements, donc par voie de
conséquence iles domaines qui les regroupent. Les recommandations formulées au niveau du
domaine peuvent alors Stre élargies à des caractéristiques environnementales, pour être
validées ultérieurement dans d’autres environnements.
8.4
Etude d’un exemple
8.4.1 Les données
Environnement
TA
EOT
SPT
EP
7
177
1,65
2,65
2,15
1 0
2,2
49
2,6
1,4
3
1,45
1,95
2,5
1,g
1 2
1,5
1,8
271
l-7
11
L2
175
22
1,g
1
0,7
o,g
2,3
1,s
4
(46
42
176
2,25
5
0,15
0,5
271
2,05
2
0,5
0,65
171
1,5
9
02
074
1J
137
6
0,15
075
1,35
1,35
13
0
0
1,3
2
8
0,k
072
173
1,65

----.-_._-.- .--__ ---_-_~--~--.-~~~
.<
8.4.2
Calcul de 1 ‘indice environnemental
Environnement
IE
1
1,43
2
0,94
3
1,95
4
1,41
5
1,20
6
0,84
7
2,04
8
0,81
9
0,823
1 0
2,03
11
1,70
1 2
1,78
13
O-83

.
8.4.3 Modélisation de la réponse des traitements ci l’environnement
1,0944x+ 0,3697
2
2
I
E 195
a8 1
!x
- Iinéaire (SpTj
.-
0
65
1
1,5 I @P) ,
0,50 I-----T--I----
lndiœ enviramemental @ha)
0
03
2
2.5
lndiœ:"ironnwen:(t/ha)
-
RegreSsion des valeurs d’un traitement par
R&rekon des valeurs d’un traitemmt par
rapport à I’IE
rapport à I’LE
y == 1,3576x- 0,8486
0
0.5
1
45
2
2S
0
0 5
2.;
Indice environnemental (tha)
hdice. enkxmemkhl <&/ha)
- _ - . - .

.-
I*I,-UIII.“-----mU-
_I ..-,...
~-I1.---I------,-,

; .
““$ML
, . .
8.4.4
Définition des domaines de réponse équivalente des traitements à l’environnement
Régression des valeurs des traitements par
rapport à PIE
3
23
2
13
1
4 _-
-
-
2 ---.---
* -- .-
03
_-
-+ IE
0 4-
+-
-t--tl-
L7
2.2
Indice environnemental @a)

8.4.5
Validation de la constitution des domaines (homogénéité des blocs1
Test de Bartlett (macro Excel)
omaine
Bloc
onnées
1
2
3
1
Var Rdt
0,21
0,57
0,19
NB Rdt
4
4
4
2
Var Rdt
0,37
0,48
0,22
NB Rdt
4
4
4
3
Var Rdt
0,61
1,04 0,26
NB Rdt
4
4
4
4
Var Rdt
0,49
0,19
NB Rdt
4
4
l-
5
Var NB Rdt Rdt
0,99 4
0,06 4
-.--^_ _
Chi2 Bartlett
1,71
0,s
1,3
Chi2 Th
14,86
11
1 5
Le Chi2 Bartlett est inf&ieur au Chi2 théorique maximal. Les blocs sont donc homogènes au
sein de chaque domaine.
8.4.6 Analyse de variance par domaine
8.4.6.1 omaine no 1
Interaction traitements*blocs
test de Tukey =0.28
Proba -0.0 135

S.c.e. dl
Carrés moyens
Test f
Proba E.t. C.V.
Var. totale
8.03
1 9
0.42
Var. facteur 1
7.35
3
2.45
46.05
0 . 0 0 0 0
c.
Var. blocs
0.04
4
0.01
0 . 1 9
0.9363
Var. résiduelle 1
0.64
1 2
0.05
0.23
26.9%
Fl
Libellés
Moyennes
Groupes homogènes
2
EP
1.64
A
3
SPT
1.25
B
1
EOT
0.35
C
4
T A
0.19
C
8.4.6.2 omaine no2
Interaction traitements*blocs
test de Tukey =0.23
Proba =O. 1607
S.c.e. dl
Carrés moyens
Test f
Proba E.t. C.V.
Var. totale
6.40
11
0.58
/
Var. facteur 1
5.62
3
1.87
17.24
0 . 0 0 2 9
Var. blocs
0.13
2
0.06
0 . 5 9
0.5875
Var. résiduelle 1
0.65
6
0.11
0.33
24.5%
Fl
Libellés
Moyennes
Groupes homogènes
2
EP
2.03
A
3
S P T
2.00
A
1
EOT
0.87
B
4
TA
0.48
B
8.4.6.3 omaine no3
Interaction traitements*blocs
Ste test de Tukey =O.Ol
Proba =0.7750
S.c.e. _ dl
Carrés moyens
Test f
Proba E.t. C.V.
Var. totale
3.11
1 9
0.16
Var. facteur 1
1.86
3
0.62
S.43
0!0029
Var. blocs
0.37
4
0.09
1.26
0.3388
Var. résiduelle 1
0.88
1 2
0.07
0.27
14.3?,‘

FI
Libellés
Moyennes
Groupes homogènes
3
S P T
2.41
A
2
EP
1
EOT
1.76
B
4
TA
1.61
B
8.4.6.4 Anova sur le regroupement des domaines
Source de variation
S.c.e dl
Carrés moyens
Test f
Rap.cm
F talc
dl f
Proba
A : totale
5.88
11
0.53
B : facteur 2
2.17
2
1.08
C : facteur 1
2.97
3
0.99
C/d
7 . 9 7
316
0.0171
: inter Et*fl
0.75
6
0.12
D/e
6.06
OI30
0.0003
E : résiduelle pondérée
3 0
0 . 0 2
Etr=0.35
8.4.6.5 Conclusions
Le test de Tukey montre une interaction traitements*blocs significative dans le domaine 1.
Les conclusions de l’analyse de ce domaine ne sont donc pas applicables à tous les blocs,
c’est à dire à tous les environnements. Aucune recommandation ne peut donc être formulée
pour ce domaine.
Toutes les autres hypothèses sont par contre vérifiées dans les autres domaines :
Pas d’interaction traitements*blocs
Une interaction traitements*domaine significative
I
8.4.7 Recommandations indépendantes dans chaque domaine
Domaine 1 : pas de réponse
Domaine 2 : EP ou SPT
1
Domaine 3 : SPT
I
I -.-----___
I
Atelicer de,fortt ,:iot~ o
r

iliottrtft-il ,‘S,‘L ;, ;,. : iI
-‘L”.‘.’
- 57 -
..;
1:
- ”
. -

_ . -

I -

- - - - - - I u
- - -
?
?
?
?
?

8.4.8
Explication de 1 ‘indice environnemental par des variables caractéristiques du milieu
et Formulation des recommandations en termes de caractéristiques du mil&
._____. -._--
- _..___._-__ ~
--_--
Interprétation de 1’IE par le pH des sols
6,OO
2,50

Annexe 1 :
Canevas de protocole expérimental
Centre de Recherche
Date de rédaction
Domaine de recherche
Chercheur responsable
Titre de l’expérience
Justificatifs de l’expérience
r cadre général de l’étude
17 état des connaissances actuelles sur le sL!jet
(Xjectifs expérimentaux
Y définition précise du but de l‘expérience
7 formulation précise des questions posées
> détermination de l’ordre de priorité des objectitk
Facteurs étudiés
‘f définition des facteurs à étudier
> définition des nii:eaus ou modalités de ces facteur-s
Conditions expérimentales
> site expér-iniental
‘Y précédent cultural
k source é\\:entuelle d’hétérogénéité.
L’nités espériinentales
7 definition précise de I*unité espérinlentale
Y drrermination du nombre d‘unités expérimentales
Disp~~sitil‘esp~rimental
7 choix du dispositif erpri.ini~ntal adquat
Yonibr’e de repétitions
>- indication de la-précision souhaitée des résultats
.
.
,
1,.


I.,~LL’I Ill~~~d~lOll du 1~0111~11 L
d 111 tklhion
UC: 1 CpLL~tIOIlS CII ~Ull~iiOl~ dC
~OLI~~L~L. JC3
rcsultats ct de la \\,ariabilité du nlatériel expérimental à utiliser

9 .
Plan d’échantillonnage
‘k détermination précise du plan d’échantillonnage lorsque, éventuellement, des
mesures ou observations seront réalisées par échantillonnage
1 0 .
Méthode d’analyse statistique
i; définition de la ou des méthodes d’analyse statistique des données qui seront
collectées
‘+ esquisse des tableaux de résultats attendus
1 1 .
Plan de l’essai
‘7 présentation du plan de l’essai tel qu’il sera mis en place
12.
Planning de réalisation de l’expérience
i calendrier de déroulement de l’expérience

Annexe 2 :
Présentation des données avant analyse
1 PRINCIPES FONDAMENTAUX
Les logiciels de statistiques courants exigent que les données soient présentées sous une
certaine forme. Elle correspond à une structure de base de données.
II s’agit de présenter les données sous la forme d’une table lignes * colonnes dont le>,
caractéristiques sont les suivantes :
_ ligne correspond aux données mesurées sur une unité expérimentale
Les colonnes correspondent :
0 .4us données d’identification des parcelles
* Aus variables mesurées présentées sous leur forme brute ou élaborée
C‘lassiquement, les colonnes sont classées dans l‘ordre suivant :
1”’ colonne : numéro de parcelle, il sert à l’identification de l’unité erperimentalc
,Imi _ Ilillllz
.-
colonne : facteurs, le contenu de ces colonnes correspond aux nI\\‘eal!s dcb,
iàcteurs. C‘ertains logiciels (comme Statitcf) exisent que les ni\\,eaus des facteurs wient cc~tleh
nuinei-icluelnelit, à partir de 1. D’autres (SAS, Genstat) supportent les libellk
alphanlllnériclt,~es. La colnbinaison de ces colonnes constitue la clé unique d’identificat itin
d’une unité expérimentale, c’est à dire qu’elle permet de décrire de façon unique c’l~que unitc
espérmientale.
( 11.’ 1 y”, ._ dernière colonne : donnk.
2
(-:AS DE DONNEES ECH.ANTILLONNEES
Si les données mesurées sur une unité expérimentale sont issues d‘un e~l-lantillorlns.~e. aIor>
c‘est la moyenne de cet échantillon qui doit figurer dans la table des données a anal~~~~.
3
(.:AS DE MESURES REPETEES :
Si des données font l‘objet d‘un sui\\ri dans le temps, c‘est à dire qu‘il s‘agit de ~nesu~~e~
t $pét<es. aloi-s elles doivent figurer- dans la table comme des mesures ponctuelle:;. et Iwl
désignation doit se terminer par le numéro de la mesure. Par- exemple. la nwwrc de I;I hautw:
Cie plantes a trois dates différentes doit se présenter SOLIS la forme de trois \\ al-iablcs fi 1 I-42. CI
t-l.3
1
(7.4s DES REGROUPEYIENTS D’ESSA1.S :

5 EXEMPLES
Présentation des données d’un essai variétal en blocs
SITE
-BLOC
ENG
1
1
TA
1
1
EOT
/
I
1
/
1
1
SPT
1 2.30
/
L~.--I--.p-
2
1
EOT
!
0.65
]
I
1
/

2
1
SPT
1
1.10
1
2
/

1
EOT
1.20
/
---.A-----.
2
j

1
SPT
1.60
1
----i--r-
Présentation des données d’un essai tuultilocai eu blocs (SAS - Genstat)

Annexe 3 :
Abaques de détermination de la
puissance d’une comparaison de plusieurs moyennes
(PEARSONETHARTLEY, 1951)
- u1=1
- q=2
- u1=3
- u*=4
- u1=c5
- il,=6
- u1=7
- u1=s
- VI=12
- u,=21
-.. _-----,-
.-w---1111-
- _ I _ P - I - * l l l l l l - l l - - - - -
-
- -

/
\\)I=l
--


Table 30 (continu&). Charts for determining
tk pcnoet of tk 1 and F tests: jàxed e&fa mode1
%= -60 30 2 0 151210 9 8
7
6
03
60
30 2 0
1s
12
10
9
8
7
6
v/ A/ /I/ /Ii /I / l/ l l Il
II /I /l
i /I
l

Il 0.99
0.96
0.96
0.95
0.95
0 94
0.94
0.92
u /ti
0.70
0.63
O,bO
0.50
0.50
0 40
0.40
0 30
0.30
0.20
0.20
0 13
1
1
2
3
- @(fora=O*OS)
, ,,
^ ^.
$o,roraE”d i -----+- i
2
3
4

VI= a603020 15 12 109 8
7
6 m 60
30
20
15
12
10
9
8
7
6
0.99,
/
I
i
/
l
I / / I / / I / /I//l/ Y
Y III I
A
A
/I
Y A
n
I/ I
l/ I
I
099
h.Ll
0.98
0.98
0.97
0.97
0.96
0.95
0.94

0.92
Q
/I/A/V Y
I/I
l
l
I
l
I
I
I
I
0.80
/ Y /I/ n
I
1 10.80
1
/ I
r
IIIII,,,",," 1
0.70
o-70
0.60
0.60
0.50
040
1
2
3
- # (fora=O*OS)
f#~(fora=O~Ol) --4- 1
2
3
4
5

1s
12
10
11,~ m 60 30 20 15 12 10 9
8
9
8
7
6
0.99
I/
Y
I
I
/I
0.98
O-96
0.95
0.94
0.92
0.90
I
I
I
1,
II
,1,
1
1
0.80 !
Ii ,,,. ‘,
Y,
,
0.70
1
1
3
+----- $I (lor a=@Os)
6, i~ora=0~01)------w1
2
3
4
5

l u,=6
~--_

--k-/-+-f
: :
:
n
!

i
0.98
o-97
x /
I l
I
I /I/ I/ v
VA A
”/ l
I/
i 0.96
II 1s
16
1
!
0.94
-:;IL
:iII'
!‘,‘I.’
I
I
I
I
1
10.80
o-70

Puissam

(l-f!)
II-
/1,,=8

-----j

-.

h.< .
t
IL--

u,=24
-