Abstract:Automatically condensing multiple topic-related scientific papers into a succinct and concise summary is referred to as Multi-Document Scientific Summarization (MDSS). Currently, while commonly used abstractive MDSS methods can generate flexible and coherent summaries, the difficulty in handling global information and the lack of guidance during decoding still make it challenging to generate better summaries. To alleviate these two shortcomings, this paper introduces summary candidates into MDSS, utilizing the global information of the document set and additional guidance from the summary candidates to guide the decoding process. Our insights are twofold: Firstly, summary candidates can provide instructive information from both positive and negative perspectives, and secondly, selecting higher-quality candidates from multiple options contributes to producing better summaries. Drawing on the insights, we propose a summary candidates fusion framework -- Disentangling Instructive information from Ranked candidates (DIR) for MDSS. Specifically, DIR first uses a specialized pairwise comparison method towards multiple candidates to pick out those of higher quality. Then DIR disentangles the instructive information of summary candidates into positive and negative latent variables with Conditional Variational Autoencoder. These variables are further incorporated into the decoder to guide generation. We evaluate our approach with three different types of Transformer-based models and three different types of candidates, and consistently observe noticeable performance improvements according to automatic and human evaluation. More analyses further demonstrate the effectiveness of our model in handling global information and enhancing decoding controllability.

Improving Abstractive Multi-document Summarization with Predicate-Argument Structure Extraction.

PELMS: Pre-training for Effective Low-Shot Multi-Document Summarization

Adapting Neural Single-Document Summarization Model for Abstractive Multi-Document Summarization: A Pilot Study.

Disentangling Specificity for Abstractive Multi-document Summarization

Disentangling Instructive Information from Ranked Multiple Candidates for Multi-Document Scientific Summarization

Towards a Neural Network Approach to Abstractive Multi-Document Summarization.

Parallel Hierarchical Transformer with Attention Alignment for Abstractive Multi-Document Summarization

Document-aware Positional Encoding and Linguistic-guided Encoding for Abstractive Multi-document Summarization

Leveraging Salience Analysis and Sparse Attention for Long Document Summarization

Leveraging Graph to Improve Abstractive Multi-Document Summarization.

SgSum: Transforming Multi-document Summarization into Sub-graph Selection

UPER: Boosting Multi-Document Summarization with an Unsupervised Prompt-based Extractor.

Multi-Document Summarization Based On Two-Level Sparse Representation Model

Abstractive Summarization Improved by WordNet-based Extractive Sentences

Deep Dependency Substructure-Based Learning for Multidocument Summarization.

Multi-document Summarization: A Comparative Evaluation

Abstractive text summarization model combining a hierarchical attention mechanism and multiobjective reinforcement learning

Modeling Endorsement for Multi-Document Abstractive Summarization

Abstractive Multi-Document Summarization Via Joint Learning with Single-Document Summarization.

Rethinking Transformer-based Multi-document Summarization: An Empirical Investigation

SALAS: Supervised Aspect Learning Improves Abstractive Multi-document Summarization Through Aspect Information Loss