Deep Learning anvendt til supernovadetektion

Fora ASTRO-FORUM NYT FRA VIDENSKABEN Deep Learning anvendt til supernovadetektion

Tagget: ,

  • Dette emne har 0 svar og 1 stemme, og blev senest opdateret for 5 år, 6 måneder siden af Bjarne. This post has been viewed 548 times
Viser 1 indlæg (af 1 i alt)
  • Forfatter
    Indlæg
  • #318903

    Bjarne
    Moderator
      • Super Nova

      Enhanced Rotational Invariant Convolutional Neural Network for Supernovae Detection

      Forfatterne foreslår i denne artikel en forbedret CNN-model (Deep Learning) til detektion af supernovaer. Dette gøres ved at anvende en ny metode til opnåelse af rotationsinvarians, som anvender cyklisk symmetri. Forfatterne anvender desuden en visualiseringsmetode, the layer-wise relevance propagation (LRP), der gør det muligt at lokalisere de relevante pixler, som bidrager til adskillelsen mellem supernovakandidater og falske objekter. En sammenligning med den oprindelige Deep-HiTS model viser, at den forbedrede metode opnår de hidtil bedste resultater på et HiTS-datasæt, idet den opnår en middelnøjagtighed på 99.53%. Forbedringen i forhold til Deep-HiTS er signifikant både statistisk og i praksis.

      In this paper, we propose an enhanced CNN model for detecting supernovae (SNe). This is done by applying a new method for obtaining rotational invariance that exploits cyclic symmetry. In addition, we use a visualization approach, the layer-wise relevance propagation (LRP) method, which allows finding the relevant pixels in each image that contribute to discriminate between SN candidates and artifacts. We introduce a measure to assess quantitatively the effect of the rotational invariant methods on the LRP relevance heatmaps. This allows comparing the proposed method, CAP, with the original Deep-HiTS model. The results show that the enhanced method presents an augmented capacity for achieving rotational invariance with respect to the original model. An ensemble of CAP models obtained the best results so far on the HiTS dataset, reaching an average accuracy of 99.53%. The improvement over Deep-HiTS is significant both statistically and in practice.

      Dette abstract holder sig ikke tilbage med hensyn til anvendelse af inforståede akronymer. Det er dog umiddelbart klart, at artiklen vedrører anvendelsen af en forbedret Deep Learning til detektion af Supernovaer.

      INTRODUKTION

      Astronomien træder ind i en ny æra med Big Data som følge af store teleskoper som Large Synoptic Survey Telescope (LSST), et 8.4m teleskop med et 3.2 Gigapixel kamera, som starter med at observere i 2022. LSST er et robotteleskop, som skal skanne hele den sydlige himmel i løbet af 3 dage. Teleskopet opsamler fotometri for 50 milliarder objekter over en 10-årig periode. Tidsdomæneastronomi studerer objekter, som varierer i tid eller retning, f.eks. supernovaer. High Cadance Transient Survey (HiTS) har til formål at detektere supernovaer i deres tidlige stadier for at opnå en forøget viden om disse eksploderende stjerners fysik. HiTS har en speciel pipeline til detektion af transienter (en transient er på amerikansk en person på gennemrejse). Den omtalte pipeline fratrækker et referencebillede fra hvert nyt billede, idet den detekterer kilder og klassificerer dem. Antallet af supernovaer vokser med afstanden, men fjernere objekter har et lavere signal/støj-forhold, hvorfor det er vigtigt at kunne reducere både falske negative detektioner og falske positive detektioner. Forfatterne har tidligere introduceret et convolution neural network (CNN) til klassifikation af detekterede kilder fra HiTS som enten sande transienter eller falske kandidater. En konventionel arkitektur indfører “foldningslag” i det neurale tetværk for at opnå translationsinvarians: En figur, som forskydes til en anden position i inputbilledet, medfører den samme klassifikation som den oprindelige figur. Det neurale netværks klassifikation burde imidlertid også være uafhængig af detektorens rotation i forhold til himlen. Forfatterne indførte i 2017 en delvis rotationsinvarians i deres CNN. De døbte denne specielle Deep Learning for Deep-HiTS (DH) modellen.

      Forfatterne forbedrer i denne artikel Deep-HiTS ved anvendelse af en ny metode til at opnå rotationsinvarians. De anvender desuden en ny visualiseringsmetode, the layer-wise relevance propagation (LRP), med henblik på at finde de relevante pixler i hvert billede, som hjælper med at adskille en supernovakandidat fra et falskt objekt. Forfatterne vurderer virkningen af den forbedrede rotationsinvariante metode med LPR ved at sammenligne med den oprindelige Deep-HiTS model.

      Årsagen til, at Deep Learning (også omtalt som kunstig intelligens) virker så godt i dette tilfælde, er at der kun findes to klasser: a) supernovakandidater og b) falske objekter (detektordefekter, kosmiske muoner).

       

    Viser 1 indlæg (af 1 i alt)
    • Du skal være logget ind for at svare på dette indlæg.