Plan pour l'analyse single top
dans le canal électron + jets
Remarques préliminaires,
générales, diverses et variées
Le but est la mise en évidence d'un signal de section efficace
très faible au milieu d'un bruit de fond de section efficace beaucoup
plus élevée. La priorité est donc d'abord l'efficacité
(sélection du signal) et seulement en deuxième lieu la pureté
(rejet du bruit de fond). Cet ordre de priorité peut évidemment
changer en fonction de la luminosité accumulée et du but
recherché (e.g. meilleure limite supérieure sur la section
efficace de production du single top).
Etudier systématiquement chaque coupure:
-> en elle-même, i.e. comprendre les distributions
observées dans les données avant coupure, en particulier
pour la variable sur laquelle s'effectue la coupure, si possible avec l'aide
du Monte Carlo.
-> en relation avec les autres, i.e. comprendre les corrélations
éventuelles avec les coupures précédentes et suivantes
en n'hésitant pas à intervertir l'ordre des coupures.
Corriger l'efficacité du trigger et des coupures sur la sélection
finale en attribuant un poids à chaque événement en
fonction de sa topologie (pT et eta de l'électron, pT et eta des
jets, etc...) et des valeurs choisies pour les coupures (e.g. l' efficacité
de sélection des light-quark jets dans JLIP).
Réorganiser le programme d'analyse en séparant les
différentes étapes de sélection.
-> introduire 1 paramètre dans Selection qui donne
le niveau de coupures?
-> séparer Selection en différentes méthodes
(Selection_W, Selection_Jets, Selection_btag, Selection_singletop)?
-
Sélection des
événements
Point de départ
- skim etrack: 1 candidat électron avec pT > 12 GeV/c et
1 trace associée (DeltaR < 0.4) avec pT > 10 GeV/c.
Autres skims intéressants
- skim diem (étude de l'efficacité de sélection
de l'électron).
-
Coupures de base
-
Trigger
p13/v11: EM15_2JT15
A faire
- estimer l'efficacité pour p14/v11 (v10, v9, v8?)
-> déterminer les turn-on
curves pour p14/v11 (v10, v9, v8?) (cf mail
de Brigitte et compte-rendu
de la discussion).
- utiliser un trigger e-mu pour le canal Soft Muon Tagging (efficacité
proche de 100%)
-> déterminer l'efficacité de la partie muon
de ce trigger en fonction de eta_mu.
- utiliser le trigger EM15_2JT15_MET10 pour v11 (non prescalé
alors que le trigger EM15_2JT15 est prescalé)?
-> déterminer l'efficacité de la partie MET10
du trigger en fonction de Etmiss.
- choisir quel trigger utiliser pour p14/v12 et en estimer l'efficacité.
-
Vertex
p13: 1 vertex primaire avec |z_vertex| < 60 et N_tracks
>= 3
Questions
- quelle est l'efficacité de cette coupure?
- qu'advient-il des autres vertex primaires?
- quelle est la probabilité de superposition d'un événement
minimum bias? d'un événement avec un jet de pT > pTmin en
fonction de pTmin?
-
Identification des W
-
Présélection
p13: 1 électron "loose" avec pT > 20 GeV/c et |eta|
< 1.1, veto sur 2ème candidat électron
A faire
- étendre l'acceptance en |eta|
en rajoutant l'intervalle 1.5 < |eta| < 2.5.
- étudier la séparation électron/jet avec/sans
une trace associée.
- vérifier que les événements rejetés
par la coupure veto sont bien tous des Z
-> distribution de masse invariante M(ee) avec/sans trace
associée et si 2 traces associées en demandant que les traces
soient de signe égal/opposé.
- estimer le bruit de fond Z+jet(s) où un des électrons
est perdu dans un crack (Z + >=2 jets) ou n'est pas identifié comme
un électron mais comme un jet (Z + >=1 jet)
-> regarder l'efficacité de sélection en fonction
de phi.
-
Optimisation de la sélection
-
électron
-
loose
p13: EMF > 0.9, H-Matrix8 < 20, Isolation < 0.15
p14: EMF > 0.9, H-Matrix8 < 75, Isolation < 0.15
A faire
- regarder la corrélation entre EMF et H-Matrix8.
- vérifier toutes les variables utilisées dans H-Matrix8.
-
tight
p13: e-likelihood > 0.4
p14: e-likelihood > 0.7 (CC) ou 0.4 (EC)
où e-likelihood utilise plusieurs variables:
- H-Matrix8
- EMF
- Isolation
- E/p matching
- DCA
- track isolation
A faire
- étudier l'efficacité sur
les événements QCD en fonction du nombre de jets, du pT et
du eta de l'électron.
- réfléchir à comment avoir un échantillon
QCD pur et non biaisé à partir des données seulement
:
-> appliquer systématiquement les mêmes coupures
que pour la sélection finale aux événements rejetés
par (un critère bien choisi, e.g. le nombre de traces associées,
de) la présélection
-> utiliser le lot de monitoring CJT5 prescale?
- quelle est l'efficacité de sélection du electron-likelihood?
-> voir les présentations de Joe Kozminski et Junjie
Zhu,
-> à vérifier sur des événements
Z->e+e-,
-> à comparer avec du Monte Carlo Z->e+e- pour déterminer
un facteur de correction prenant en compte une éventuelle différence
données/Monte Carlo,
-> à vérifier sur du Monte Carlo single top
et W+jets pour voir l'influence éventuelle de l'environnement hadronique
et de la topologie des événements sur cette efficacité,
-> étudier la dépendance en eta, phi (Etmiss?
H-Matrix?) de cette efficacité sur du Monte Carlo aussi bien QCD
que W+jets et single top.
- utiliser la méthode Orthogonals Samples (cf page Single
Top QCD Background Measurement Method) et comparer les résultats
avec la méthode de la matrice.
-
neutrino
p13: ETmiss > 15 GeV
A faire
- regarder la distribution en Etmiss d'un lot avec un fake électron
(jet qui passe tous les critères e-ID sauf un) pour voir l'importance
du problème de sur-calibration électromagnétique.
- inversement, étudier une éventuelle variation de
l'efficacité e-ID sur le bruit de fond QCD en fonction de Etmiss.
-
Combinaison électron/neutrino
p13: DeltaPhi(e,ETmiss) > 0.5, (20/pi) DeltaPhi(e,ETmiss)
- ETmiss <0 (triangle cut #1)
A faire
- étudier ces coupures et décider
de les garder ou de les modifier ou de ne pas les inclure du tout.
- étudier la masse transverse MT(e,nu), en particulier la
résolution en fonction du nombre de jets.
- combiner MT(e,nu) avec e-likelihood et/ou Etmiss
-> utiliser la méthode de la matrice pour estimer
les contributions respectives du signal (W) et du bruit de fond (QCD) en
fonction de deux de ces variables et trouver le(s) meilleur(s) critère(s)
de séparation.
-
Coupures sur les jets
-
Identification des jets
p13: 0.05 < EMF < 0.95, CHF < 0.4, HotF < 10,
n90 > 1 et critères sur f90
p14: même chose sauf critères sur f90 remplacés
par critères de validation L1
A faire
- étudier l'efficacité jet-id
en fonction de eta, en particulier dans la zone ICD-MG.
- vérifier que l'efficacité jet-id ne dépend
pas de ET des jets.
- étudier (comparaison avec Monte
Carlo) toutes les variables possibles et imaginables sur les jets, i.e.
les variables ci-dessus ainsi que les densités d'énergie
en fonction de phi, eta et DeltaR, à différents pT, eta,
N_jets et séparément pour les événements W
et QCD.
Info
- la Jet Energy Scale va être déterminée par
Saclay en tenant compte de EMF pour les jets légers, mais pas pour
les jets de b (à vérifier).
A faire
- utiliser la b-quark Jet Energy Scale?
-> étudier sa pertinence pour le single top,
-> déterminer la b-quark Jet Energy Scale pour p14
en utilisant EMF?
-
Sélection basée sur les jets
p13:
- DeltaR(e,jet) > 0.5 (suppression de l'électron de la liste
des jets)
- >= 2 "bons" jets avec ET > 15 GeV et |eta| < 2.5
- (20/pi) DeltaPhi(jets,ETmiss) - ETmiss < 0 (triangle cut #2)
- (20/pi) DeltaPhi(jets,ETmiss) + ETmiss > 20 (triangle cut #3)
A faire
- vérifier que le critère DeltaR(e,jet)>0.5 enlève
seulement 1 jet et que c'est bien l'électron.
- étudier les coupures triangulaires
et décider de les garder ou de les modifier ou de ne pas les inclure
du tout.
-> regarder l'effet de ces coupures après identification
des jets de b.
- étudier systématiquement (comparaison avec Monte
Carlo) pour les événements W + n jet(s) les migrations entre
différents bins de n en fonction de ET_jet, éventuellement
en fonction des variables de jet-id, à différents eta, pT_electron,
pT_W, etc...
-
Identification des jets de b
p13: soft muon b-tagging, i.e. muon "medium", DeltaR(mu,jet)
< 0.5, pT_mu > 4 GeV/c, |eta_mu| < 2
Questions
- dans l'analyse actuelle, l'utilisation conjointe des cuts topologiques
et du soft-muon b-tagging détériore le rapport "signal" (W,
t-tbar, + single top) sur "bruit" (QCD) par rapport à l'utilisation
du soft-muon b-tagging tout seul (7/4 sans cuts topologiques, 2/2 avec
cuts topologiques): est-ce dû uniquement à l'absence de W
+ b-bbar et W + c-cbar dans la simulation?
- soft muon b-tagging :
- quelle en est l'efficacité et la probabilité
de fake?
- peut-on utiliser les muons "loose"?
- y-a t'il un lien dans TopTree entre un jet tagge par SMT
et son muon associé?
Info
- les tag rate functions du soft muon b-tagging vont être
déterminées par Jan Stark.
A faire
- utiliser le soft muon b-tagging et/ou
JLIP (variation continue du paramètre) pour déterminer la
composition en saveur des jets du bruit de fond W + jets (fit en pTrel?).
- séparer les deux analyses correspondant
aux deux méthodes de b-tagging (soft muon b-tagging d'abord, JLIP
ensuite) en séparant les événements en deux lots :
- 1er lot : trigger e-mu, >= 1 b taggé par Soft Muon
Tagging (13% de la voie t, 16% de la voie s)
- séparer à nouveau en trois lots en fonction
du tagging sur le(s) jet(s) restant(s), et donc du nombre de taggings dans
l'événement :
a) >= 2 SMT
-> optimiser le soft
muon b-tagging pour le deuxième tag?
b) 1 SMT + SMT veto sur le(s) jet(s) restant(s)
+ >=1 JLIP sur le(s) jet(s) restant(s)
-> optimiser JLIP pour le
deuxième tag?
c) 1 SMT + (SMT,JLIP) veto sur le(s) jet(s)
restant(s)
- étudier les événements où
le jet avec SMT est aussi taggé par JLIP.
- 2ème lot : trigger EM15_2JT15_MET10, SMT veto, >= 1
b taggé par JLIP (87% . 35% de la voie t (en général
1 seul tag) et 84% . (2 . 35% - (35%)**2) de la voie s)
- séparer à nouveau en deux lots en fonction
du tagging sur le(s) jet(s) restant(s), et donc du nombre de jets taggés
dans l'événement:
a) 1 JLIP
b) >=2 JLIP
-> optimiser JLIP pour le
deuxième tag?
- utiliser un critère plus sévère sur
JLIP pour les événements de a) pour supprimer complètement
le bruit de fond (efficacité de tagging sur les b: 0.5->0.3 => efficacité
sur les light-quark jets: 1%->0.1%)
- étudier la (les) méthode(s) de b-tagging avec/sans
coupures topologiques.
-
Études Monte Carlo et
coupures basées sur la topologie des événements
p13: HT > 125 GeV, ET_jet1 + 4 ETmiss > 155 GeV, ET_jet3
+ 5 * ET_jet4 < 47 GeV
Question
- connaissant les contributions QCD (méthode de la matrice)
et ttbar (mesurée sur les données) ainsi que les efficacités
des coupures topologiques sur W+jets et single top une fois passé
un b-tagging, peut-on appliquer une méthode de la matrice pour déterminer
la contribution de W+jets et de single top avant ou après coupures
topologiques?
-> en principe oui, du moment que les efficacités
de ces coupures topologiques sont suffisamment différentes entre
le signal single top et le bruit de fond W+jets (à vérifier).
A faire
- étudier (à partir du Monte
Carlo au niveau hadron d'abord, au niveau détecteur ensuite) la
cinématique du signal comparées à celle du (des) bruit(s)
de fond physique(s), i.e. hors QCD
-> pT et eta de l'électron,
-> pT du neutrino et du W,
-> corrélations entre Et,
eta des différents jets (ET_jet1 - ET_jet2, ...),
-> nombre de jets en fonction du
(des) seuils en Et et/ou de l'acceptance en eta.
- étudier la reconstruction de M_top
-> reconstruction de pZ(nu): comment choisir la bonne solution
parmi les deux fournies par la contrainte cinématique sur la masse
invariante M(e,nu)=mW (minimisation de Sum(pZ) dans l'événement,
polarisation du W, etc...)?
-> identification du jet de b venant de la désintégration
du top?
- étudier les variables présentées au single
top workshop par Slava Bunichev.
- regarder les distributions de plusieurs variables topologiques
et construire un likelihood-ratio à partir des plus significatives.
- étudier la dépendance de l'efficacité des
coupures topologiques estimée sur le lot de contrôle QCD (HMatrix>75?
Likelihood<0.7? anti-critère sur l'isolation?) en fonction de
la variable sur laquelle s'effectue la séparation électron-jet.
- dans le canal avec Soft Muon Tagging, étudier le muon
en corrélation avec le jet taggé en comparant le signal (single
top) avec les différents bruits de fond (W + b-bbar, W + c-cbar,
W + light quark jets, QCD).
- optimiser les coupures topologiques en fonction du nombre de
b-tagging?
-
Sélection finale
p13: application successive des coupures de présélection,
puis des coupures topologiques, enfin du Soft Muon Tagging
A faire
- combiner les limites obtenues sur les lots statistiquement indépendants
correspondant aux différents critères de b-tagging et aux
différentes multiplicités en jets taggés.
- combiner les différentes analyses correspondant aux différentes
méthodes de b-tagging en ajoutant les événements correctement
pondérés en une seule distribution d'une variable topologique
bien choisie (likelihood-ratio de différentes variables)?
Page maintenue par: Bernard
Andrieu
17 décembre 2003