Corrigindo formatação de texto vindo de PDFs no LibreOffice
Quando se copia e cola um pedaço de texto de um arquivo de PDF para um editor, muitas vezes o mesmo vem com quebras de parágrafo em posições inesperadas. Essa é uma situação recorrente quando se trabalha com texto vindo de PDFs. Mas contornar esse problema não é tão difícil.
No LibreOffice é possível substituir todas as quebras de parágrafo por um espaço, consertando a formatação em questão. Mas antes disso, recomendo ligar a opção "Alternar marcas de formatação" utilizando o atalho Ctrl+F10. Isso irá te mostrar onde está cada espaço, quebra de linha, tabulação, etc, no seu texto.
Feito isso, uma rápida batida de olho já vai te ajudar a entender onde você precisa realmente corrigir a quebra de linha. Selecione a área em questão e abra a janela de Localizar e Substituir (Ctrl+H).
Na metade inferior da janela (expanda a seção "Outras opções" se não estiver visível por padrão) você precisará marcar a opção "Expressões regulares" e também "Somente na seleção atual" (pois você não quer alterar as quebras de linha do resto do documento, né?).
Na primeira caixa de texto, onde está escrito "Localizar", insira o simbolo de dólar (sem aspas): "$"
O LibreOffice vai entender isso como a quebra de linha. Na caixa seguinte, a de "Substituir", simplesmente digite um espaço. Isso porque se você não substituir a quebra de linha por um espaço, as palavras ficarão coladas onde antes era o fim do parágrafo.
Pronto! A mágica está feita. Dependendo do tamanho do texto que você tem, isso pode ser muito mais rápido do que manualmente apertar delete e barra de espaço no final de cada linha.
Dica bônus: Mas e se eu quiser que cada quebra de linha vire DUAS?
Supondo que esse seja o seu caso, você pode digitar "\n\n" na caixa de Substituição. cada "\n" representa uma nova quebra de linha. Conhecendo um pouco de expressões regulares (regex) é possível fazer todo o tipo de substituição complexa.
Mas ai já é assunto pra outro dia!