Plan pour l'analyse single top 
dans le canal électron + jets

 
 


Remarques préliminaires, générales, diverses et variées

Le but est la mise en évidence d'un signal de section efficace très faible au milieu d'un bruit de fond de section efficace beaucoup plus élevée. La priorité est donc d'abord l'efficacité (sélection du signal) et seulement en deuxième lieu la pureté (rejet du bruit de fond). Cet ordre de priorité peut évidemment changer en fonction de la luminosité accumulée et du but recherché (e.g. meilleure limite supérieure sur la section efficace de production du single top).

Etudier systématiquement chaque coupure:
  -> en elle-même, i.e. comprendre les distributions observées dans les données avant coupure, en particulier pour la variable sur laquelle s'effectue la coupure, si possible avec l'aide du Monte Carlo.
  -> en relation avec les autres, i.e. comprendre les corrélations éventuelles avec les coupures précédentes et suivantes en n'hésitant pas à intervertir l'ordre des coupures.

Corriger l'efficacité du trigger et des coupures sur la sélection finale en attribuant un poids à chaque événement en fonction de sa topologie (pT et eta de l'électron, pT et eta des jets, etc...) et des valeurs choisies pour les coupures (e.g. l' efficacité de sélection des light-quark jets dans JLIP).

Réorganiser le programme d'analyse en séparant les différentes étapes de sélection.
  -> introduire 1 paramètre dans Selection qui donne le niveau de coupures?
  -> séparer Selection en différentes méthodes (Selection_W, Selection_Jets, Selection_btag, Selection_singletop)?
 
 

  1. Sélection des événements

  2.  
    Point de départ
    - skim etrack: 1 candidat électron avec pT > 12 GeV/c et 1 trace associée (DeltaR < 0.4) avec pT > 10 GeV/c.
    Autres skims intéressants
    - skim diem (étude de l'efficacité de sélection de l'électron).
     
     
    1. Coupures de base

    2.  
      1. Trigger

      2. p13/v11: EM15_2JT15
        A faire
        - estimer l'efficacité pour p14/v11 (v10, v9, v8?)
          -> déterminer les turn-on curves pour p14/v11 (v10, v9, v8?) (cf mail de Brigitte et compte-rendu de la discussion).
        - utiliser un trigger e-mu pour le canal Soft Muon Tagging (efficacité proche de 100%)
          -> déterminer l'efficacité de la partie muon de ce trigger en fonction de eta_mu.
        - utiliser le trigger EM15_2JT15_MET10 pour v11 (non prescalé alors que le trigger EM15_2JT15 est prescalé)?
          -> déterminer l'efficacité de la partie MET10 du trigger en fonction de Etmiss.
        - choisir quel trigger utiliser pour p14/v12 et en estimer l'efficacité.
         
      3. Vertex

      4. p13: 1 vertex primaire avec |z_vertex| < 60 et N_tracks >= 3
        Questions
        - quelle est l'efficacité de cette coupure?
        - qu'advient-il des autres vertex primaires?
        - quelle est la probabilité de superposition d'un événement minimum bias? d'un événement avec un jet de pT > pTmin en fonction de pTmin?
         
         
    3. Identification des W

    4.  
      1. Présélection

      2. p13: 1 électron "loose" avec pT > 20 GeV/c et |eta| < 1.1, veto sur 2ème candidat électron
        A faire
        - étendre l'acceptance en |eta| en rajoutant l'intervalle 1.5 < |eta| < 2.5.
        - étudier la séparation électron/jet avec/sans une trace associée.
        - vérifier que les événements rejetés par la coupure veto sont bien tous des Z
          -> distribution de masse invariante M(ee) avec/sans trace associée et si 2 traces associées en demandant que les traces soient de signe égal/opposé.
        - estimer le bruit de fond Z+jet(s) où un des électrons est perdu dans un crack (Z + >=2 jets) ou n'est pas identifié comme un électron mais comme un jet (Z + >=1 jet)
          -> regarder l'efficacité de sélection en fonction de phi.
         
      3. Optimisation de la sélection

      4.  
        1. électron

        2.  
          1. loose

          2. p13: EMF > 0.9, H-Matrix8 < 20, Isolation < 0.15
            p14: EMF > 0.9, H-Matrix8 < 75, Isolation < 0.15
            A faire
            - regarder la corrélation entre EMF et H-Matrix8.
            - vérifier toutes les variables utilisées dans H-Matrix8.
             
          3. tight

          4. p13: e-likelihood > 0.4
            p14: e-likelihood > 0.7 (CC) ou 0.4 (EC)
            où e-likelihood utilise plusieurs variables:
            - H-Matrix8
            - EMF
            - Isolation
            - E/p matching
            - DCA
            - track isolation
            A faire
            - étudier l'efficacité sur les événements QCD en fonction du nombre de jets, du pT et du eta de l'électron.
            - réfléchir à comment avoir un échantillon QCD pur et non biaisé à partir des données seulement :
              -> appliquer systématiquement les mêmes coupures que pour la sélection finale aux événements rejetés par (un critère bien choisi, e.g. le nombre de traces associées, de) la présélection
              -> utiliser le lot de monitoring CJT5 prescale?
            - quelle est l'efficacité de sélection du electron-likelihood?
              -> voir les présentations de Joe Kozminski et Junjie Zhu,
              -> à vérifier sur des événements Z->e+e-,
              -> à comparer avec du Monte Carlo Z->e+e- pour déterminer un facteur de correction prenant en compte une éventuelle différence données/Monte Carlo,
              -> à vérifier sur du Monte Carlo single top et W+jets pour voir l'influence éventuelle de l'environnement hadronique et de la topologie des événements sur cette efficacité,
              -> étudier la dépendance en eta, phi (Etmiss? H-Matrix?) de cette efficacité sur du Monte Carlo aussi bien QCD que W+jets et single top.
            - utiliser la méthode Orthogonals Samples (cf page Single Top QCD Background Measurement Method) et comparer les résultats avec la méthode de la matrice.
             
        3. neutrino

        4. p13: ETmiss > 15 GeV
          A faire
          - regarder la distribution en Etmiss d'un lot avec un fake électron (jet qui passe tous les critères e-ID sauf un) pour voir l'importance du problème de sur-calibration électromagnétique.
          - inversement, étudier une éventuelle variation de l'efficacité e-ID sur le bruit de fond QCD en fonction de Etmiss.
           
        5. Combinaison électron/neutrino

        6. p13: DeltaPhi(e,ETmiss) > 0.5, (20/pi) DeltaPhi(e,ETmiss) - ETmiss <0 (triangle cut #1)
          A faire
          - étudier ces coupures et décider de les garder ou de les modifier ou de ne pas les inclure du tout.
          - étudier la masse transverse MT(e,nu), en particulier la résolution en fonction du nombre de jets.
          - combiner MT(e,nu) avec e-likelihood et/ou Etmiss
            -> utiliser la méthode de la matrice pour estimer les contributions respectives du signal (W) et du bruit de fond (QCD) en fonction de deux de ces variables et trouver le(s) meilleur(s) critère(s) de séparation.
           
           
    5. Coupures sur les jets

    6.  
      1. Identification des jets

      2. p13: 0.05 < EMF < 0.95, CHF < 0.4, HotF < 10, n90 > 1 et critères sur f90
        p14: même chose sauf critères sur f90 remplacés par critères de validation L1
        A faire
        - étudier l'efficacité jet-id en fonction de eta, en particulier dans la zone ICD-MG.
        - vérifier que l'efficacité jet-id ne dépend pas de ET des jets.
        - étudier (comparaison avec Monte Carlo) toutes les variables possibles et imaginables sur les jets, i.e. les variables ci-dessus ainsi que les densités d'énergie en fonction de phi, eta et DeltaR, à différents pT, eta, N_jets et séparément pour les événements W et QCD.
        Info
        - la Jet Energy Scale va être déterminée par Saclay en tenant compte de EMF pour les jets légers, mais pas pour les jets de b (à vérifier).
        A faire
        - utiliser la b-quark Jet Energy Scale?
          -> étudier sa pertinence pour le single top,
          -> déterminer la b-quark Jet Energy Scale pour p14 en utilisant EMF?
         
      3. Sélection basée sur les jets

      4. p13:
        - DeltaR(e,jet) > 0.5 (suppression de l'électron de la liste des jets)
        - >= 2 "bons" jets avec ET > 15 GeV et |eta| < 2.5
        - (20/pi) DeltaPhi(jets,ETmiss) - ETmiss < 0 (triangle cut #2)
        - (20/pi) DeltaPhi(jets,ETmiss) + ETmiss > 20 (triangle cut #3)
        A faire
        - vérifier que le critère DeltaR(e,jet)>0.5 enlève seulement 1 jet et que c'est bien l'électron.
        - étudier les coupures triangulaires et décider de les garder ou de les modifier ou de ne pas les inclure du tout.
          -> regarder l'effet de ces coupures après identification des jets de b.
        - étudier systématiquement (comparaison avec Monte Carlo) pour les événements W + n jet(s) les migrations entre différents bins de n en fonction de ET_jet, éventuellement en fonction des variables de jet-id, à différents eta, pT_electron, pT_W, etc...
         
         
    7. Identification des jets de b

    8.  
      p13: soft muon b-tagging, i.e. muon "medium", DeltaR(mu,jet) < 0.5, pT_mu > 4 GeV/c, |eta_mu| < 2
      Questions
      - dans l'analyse actuelle, l'utilisation conjointe des cuts topologiques et du soft-muon b-tagging détériore le rapport "signal" (W, t-tbar, + single top) sur "bruit" (QCD) par rapport à l'utilisation du soft-muon b-tagging tout seul (7/4 sans cuts topologiques, 2/2 avec cuts topologiques): est-ce dû uniquement à l'absence de W + b-bbar et W + c-cbar dans la simulation?
      - soft muon b-tagging :
        - quelle en est l'efficacité et la probabilité de fake?
        - peut-on utiliser les muons "loose"?
        - y-a t'il un lien dans TopTree entre un jet tagge par SMT et son muon associé?
      Info
      - les tag rate functions du soft muon b-tagging vont être déterminées par Jan Stark.
      A faire
      - utiliser le soft muon b-tagging et/ou JLIP (variation continue du paramètre) pour déterminer la composition en saveur des jets du bruit de fond W + jets (fit en pTrel?).
      - séparer les deux analyses correspondant aux deux méthodes de b-tagging (soft muon b-tagging d'abord, JLIP ensuite) en séparant les événements en deux lots :
      - 1er lot : trigger e-mu, >= 1 b taggé par Soft Muon Tagging (13% de la voie t, 16% de la voie s)
        - séparer à nouveau en trois lots en fonction du tagging sur le(s) jet(s) restant(s), et donc du nombre de taggings dans l'événement :
           a) >= 2 SMT
              -> optimiser le soft muon b-tagging pour le deuxième tag?
          b) 1 SMT + SMT veto sur le(s) jet(s) restant(s) + >=1 JLIP  sur le(s) jet(s) restant(s)
             -> optimiser JLIP pour le deuxième tag?
          c) 1 SMT + (SMT,JLIP) veto sur le(s) jet(s) restant(s)
        - étudier les événements où le jet avec SMT est aussi taggé par JLIP.
      - 2ème lot : trigger EM15_2JT15_MET10, SMT veto, >= 1 b taggé par JLIP (87% . 35% de la voie t (en général 1 seul tag) et 84% . (2 . 35% - (35%)**2) de la voie s)
        - séparer à nouveau en deux lots en fonction du tagging sur le(s) jet(s) restant(s), et donc du nombre de jets taggés dans l'événement:
          a) 1 JLIP
          b) >=2 JLIP
             -> optimiser JLIP pour le deuxième tag?
        - utiliser un critère plus sévère sur JLIP pour les événements de a) pour supprimer complètement le bruit de fond (efficacité de tagging sur les b: 0.5->0.3 => efficacité sur les light-quark jets: 1%->0.1%)
      - étudier la (les) méthode(s) de b-tagging avec/sans coupures topologiques.
       
       
    9. Études Monte Carlo et coupures basées sur la topologie des événements

    10.  
      p13: HT > 125 GeV, ET_jet1 + 4 ETmiss > 155 GeV, ET_jet3 + 5 * ET_jet4 < 47 GeV
      Question
      - connaissant les contributions QCD (méthode de la matrice) et ttbar (mesurée sur les données) ainsi que les efficacités des coupures topologiques sur W+jets et single top une fois passé un b-tagging, peut-on appliquer une méthode de la matrice pour déterminer la contribution de W+jets et de single top avant ou après coupures topologiques?
        -> en principe oui, du moment que les efficacités de ces coupures topologiques sont suffisamment différentes entre le signal single top et le bruit de fond W+jets (à vérifier).
      A faire
      - étudier (à partir du Monte Carlo au niveau hadron d'abord, au niveau détecteur ensuite) la cinématique du signal comparées à celle du (des) bruit(s) de fond physique(s), i.e. hors QCD
        -> pT et eta de l'électron,
        -> pT du neutrino et du W,
        -> corrélations entre Et, eta des différents jets (ET_jet1 - ET_jet2, ...),
        -> nombre de jets en fonction du (des) seuils en Et et/ou de l'acceptance en eta.
      - étudier la reconstruction de M_top
        -> reconstruction de pZ(nu): comment choisir la bonne solution parmi les deux fournies par la contrainte cinématique sur la masse invariante M(e,nu)=mW (minimisation de Sum(pZ) dans l'événement, polarisation du W, etc...)?
        -> identification du jet de b venant de la désintégration du top?
      - étudier les variables présentées au single top workshop par Slava Bunichev.
      - regarder les distributions de plusieurs variables topologiques et construire un likelihood-ratio à partir des plus significatives.
      - étudier la dépendance de l'efficacité des coupures topologiques estimée sur le lot de contrôle QCD (HMatrix>75? Likelihood<0.7? anti-critère sur l'isolation?) en fonction de la variable sur laquelle s'effectue la séparation électron-jet.
      - dans le canal avec Soft Muon Tagging, étudier le muon en corrélation avec le jet taggé en comparant le signal (single top) avec les différents bruits de fond (W + b-bbar, W + c-cbar, W + light quark jets, QCD).
      - optimiser les coupures topologiques en fonction du nombre de b-tagging?
       
       
    11. Sélection finale

    12.  
      p13: application successive des coupures de présélection, puis des coupures topologiques, enfin du Soft Muon Tagging
      A faire
      - combiner les limites obtenues sur les lots statistiquement indépendants correspondant aux différents critères de b-tagging et aux différentes multiplicités en jets taggés.
      - combiner les différentes analyses correspondant aux différentes méthodes de b-tagging en ajoutant les événements correctement pondérés en une seule distribution d'une variable topologique bien choisie (likelihood-ratio de différentes variables)?

      Page maintenue par: Bernard Andrieu
      17 décembre 2003