An Automated Bug Triaging Approach using Deep Learning: A Replication Study

Eray Tüzün,Emre Dogan,Alperen Çetin
DOI: https://doi.org/10.31590/EJOSAT.781341
2021-01-12
Abstract:Hata yonetimi hatalari belirleme ve cozme surecidir. Hata yonetimi surecinde, bir hatanin belirlendikten sonra triyajlanmasi gerekir. Hata triyajlama sureci hatanin onceliklendirilmesi ve hatanin uygun bir gelistiriciye atanmasi seklinde gerceklesir. Bu surecin asil kismi verilen bir hata raporunu cozmek icin en uygun gelistiriciyi tahmin edebilmektir. Bu hata raporlarinin metinsel kisimlarinin (hata basligi, hata tanimi) girdi oldugu ve onerilecek olan gelistiricilerin de cikti oldugu bir siniflandirma problem olarak tanimlanabilir. Otomatik olarak yapilmayan hata triyajlama zaman alan bir surec oldugundan, hata triyajlamayi otomatik hale getirmek uzerine bircok algoritma bulunmaktadir. Gectigimiz yillarda bu problem uzerinde calisan en son basarili modellerden biri de Deep Triage’dir. Bu model siniflandirma icin derin, iki yonlu ve dikkatli tekrarlayan sinir agi (DBRNN-A) kullanmaktadir. Bu calismada biz literaturdeki basarili bir hata triyajlama yontemi olan Deep Triage’in gelistirilmis bir versiyonunu gerceklestirdik. Makalede onceden onerilen modelin performansini artirmak icin original calismaya uc katkida bulunduk: (1) Ayni bellek miktariyla daha buyuk veri gruplari kullanarak egitme zamanini dusurmek icin LSTM yerine GRU kullanmak, (2) Daha genel bir model olusturmak icin farkli veri setlerinin birlesmesinden olusan bir sozluk kullanma ve (3) Sonuclari iyilestirmek icin cok sinifli siniflandirmadan once ilave sinir agi katmanlari koyma. Gerceklestirdigimiz deneylerin sonucunda Mozilla Firefox veri setinde %46.6 dogruluk ile original calismayla ayni sonuclari elde ettik. Chromium ver setinde ise orijinal calismadan (%42.7) daha yuksek bir dogruluk (%44.0) elde ettik. Bu konu hakkindaki ilerideki calismalar icin gelistirilmis model ve kaynak kodu paylasilmistir.
Art
What problem does this paper attempt to address?