Un exposé à faire, un article à écrire, facile, Internet, Google, copier, coller dans OpenOffice.org et basta !

Oui, mais quel résultat !

Lorsqu’on importe un texte venu d’Internet dans OpenOffice.org, on importe en même temps tout un tas d’éléments cachés qui provoquent le plus souvent des affichages quelque peu anarchiques. Nous allons donc voir comment nettoyer ces éléments parasites qui peuvent être des sections, des sauts de paragraphes répétitifs, des sauts de lignes en lieu et place de sauts de paragraphes, des successions d’espaces ou de tabulations, des tableaux inutiles, des images encore plus inutiles…

Pour cela, dans OpenOffice.org, nous allons devoir demander l’affichage des caractères non imprimables et utiliser le navigateur pour avoir une bonne vision des sections, des tableaux, des titres, des images…

Nous allons ensuite utiliser la recherche – remplacement avec ce que l’on nomme « expressions régulières » ainsi que les styles par défaut, nous terminerons par la gestion des images.

Configuration d’OpenOffice.org

Affichage

Dans le menu affichage, nous allons cocher les délimitations du texte, la trame de fond des champs et les caractères non imprimables.
Les délimitations du texte nous affichent les marges du document. on peut les configurer par le menu « Format », onglet « Page ».
La trame de fond des champs va nous permettre de repérer les caractères insécables qui se teinteront de gris.
L’affichage des caractères non imprimables va mettre en évidence les sauts de lignes, les sauts de paragraphes, les espaces, les tabulations…

Le navigateur

Nous allons aussi utiliser le navigateur. On y accède toujours par le menu « Affichage », par la touche F5, ou par un clic sur l’outil en forme de boussole dans la barre d’outils.
Ce navigateur va nous aider à gérer les sections, les tableaux, les images, les titres…

Ancrage du navigateur OpenOffice.orgA la première utilisation, le navigateur apparaît dans une fenêtre séparée.

Si comme moi vous préférez les fenêtres ancrées, et si votre écran est assez large, faites un « CTRL – Double clic » dans la zone grise qui contient les boutons, mais sans cliquer sur un bouton.



La fenêtre se placera alors à gauche de votre document et sera repliable à volonté grâce aux pointillés en bordure de fenêtre.

De la même manière, nous afficherons plus tard la fenêtre des styles.


Application du formatage par défaut

Nous en sommes donc à copier un texte depuis un site Web – en faisant attention de ne pas sélectionner trop large pour éviter de ramener trop d’objets parasites – et à coller notre sélection dans un « nouveau » document OpenOffice.org. (Je conseille de prendre un nouveau document car nos manipulations risquent parfois de se révéler aventureuses. Une fois satisfait du résultat, nous pourrons intégrer notre travail dans le document de destination.)

J’ai utilisé comme exemple une page Web du conseil général du Morbihan relatives aux randonnées.

Ce n’est pas le cas ici, mais il arrive parfois que les polices du document soient énormes ou minuscules, dans ce cas nous commencerions par tout sélectionner puis par le menu format appliquer un formatage par défaut.
La taille des titres serait encore importante mais nous règlerions cela plus tard.

Le formatage par défaut n’est ici qu’un confort visuel. Nous peaufinerons plus tard l’ensemble des styles du document. Ne vous inquiétez donc pas si le résultat ne vous convient pas pour l’instant.

Ci-dessous, des exemples de polices trop petites ou trop grandes.


Application du formatage par défaut.

<– Avant Après –>


Suppression des sections

Assez souvent – et c’est le cas pour notre page exemple – la copie dans OpenOffice.org laisse apparaître quantité de lignes horizontales grises. Ce sont des sauts de section. Je suppose que certains éditeurs de textes mettent des sauts de section en lieu et place des sauts de paragraphe.
Ici, c’est le navigateur qui va nous aider.

Affichons le navigateur

Le signe « + » devant les sections signifie qu’il y a au moins une section – une trentaine dans notre exemple – que nous allons supprimer.

Sur l’image ci-contre, j’ai cliqué sur le « + » devant les sections. Le « + » se transforme en « - » et toutes les sections apparaissent.

La suppression des sections n’efface pas leur contenu mais rassemble le tout en une seule section globale.


Méthode :

Clic-droit/éditer sur n’importe quelle section affiche la fenêtre « Editer les sections ».

Dans cette nouvelle fenêtre, on clique sur une des sections qui apparaissent dans la liste de gauche puis par « CTRL + A » on sélectionne l’ensemble des sections avant de cliquer sur le bouton « Supprimer » qui se trouve à droite.

Lorsqu’on valide par « OK », comme on le voit sur l’image ci-contre, les lignes grises du document disparaissent, le signe « + » des sections dans le navigateur disparaît lui aussi.


Suppression des tableaux inutiles

On trouve encore sur Internet de nombreux sites réalisés sur des tableaux. (Voir à ce sujet l’article « En quoi la mise en page par tableaux est-elle stupide ?« )

Si les tableaux importés ont vraiment une utilité, s’ils présentent des données en lignes et colonnes, il convient de les laisser.

Dans le cas contraire, il faut les convertir en texte. Pour cela, on se place dans le tableau (simple clic dans une cellule) puis par le menu « Tableau / Convertir / Tableau en texte », avec l’option « Tabulation », on transforme le tableau en véritable texte.

On peut parfois avoir besoin de passer par le menu « Tableau / Sélectionner / Ligne ou colonne » pour quelques cas particuliers.

Les paragraphes

Transformation des sauts de ligne en sauts de paragraphes

Il s’agit ici de se débarrasser des retours à la ligne à l’intérieur d’un paragraphe. Ils sont marqués par les petites flèches de retour – en rouge sur l’image – et nous allons les remplacer par des sauts de paragraphes, comme ici en vert.

Ces retours à la ligne sont issus de certains éditeurs de texte et sont particulièrement gênants lorsque le format du texte est « Justifié » – aligné à gauche ET à droite – car l’espace entre les mots est exagérément agrandie. (Pas de faute d’orthographe ici, espace est féminin en typographie.) De plus, si vos réglages prévoient un espacement entre les paragraphes, celui-ci ne s’appliquera pas au retour ligne.

Pour mémoire, le retour ligne s’obtient par « Maj + Entrée », essayez de voir ce que cela donne dans un texte justifié !

Recherche – Remplacement

Ouvrons la fenêtre de « Recherche – Remplacement » par le menu « Edition / Rechercher & Remplacer… » ou par « CTRL + F ».

Nous allons utiliser les expressions régulières et pour cela nous allons déployer les « Autres options » par le bouton du bas de la fenêtre et cocher la case « Expressions régulières ».

Dans la fenêtre de « Recherche – Remplacement », le bouton « Aide » ouvre une fenêtre dans laquelle, au paragraphe « Expressions régulières », nous pourrons afficher la « liste des expressions régulières ». De cette liste est tirée l’explication ci-dessous.

[Citation : aide OpenOffice.org]
\n Représente un retour à la ligne qui a été inséré à l’aide de la combinaison de touches Maj+Entrée. Pour remplacer un retour à la ligne par un saut de paragraphe, tapez \n dans les zones Rechercher et Remplacer par et lancez le remplacement.
\n dans la zone de texte Rechercher correspond à un saut de ligne saisi avec la combinaison de touches Maj+Entrée.
\n dans la zone de texte Remplacer par correspond à un saut de paragraphe saisi manuellement avec la touche Entrée ou Retour.
[fin de citation]

Nous avons là une bizarrerie d’OpenOffice.org car « \n » n’a pas la même signification dans le champ « Rechercher » que dans le champ « Remplacer ». Étrange, mais bon…

Comme montré sur l’image ci-dessus, nous tapons donc « \n » (AltGr + touche 8) dans les deux champs et nous pressons le bouton « Tout remplacer »…

Suppression des répétitions de sauts de paragraphes

Si deux sauts de paragraphes se suivent, on peut considérer que le deuxième est un paragraphe vide. Nous allons donc supprimer tous les paragraphes vides en utilisant une nouvelle fois les « expressions régulières ».

Toujours dans l’aide citée plus haut, nous pouvons lire : « ^$ Recherche un paragraphe vide ». Donc dans la fenêtre de « Recherche – Remplacement », affichée par « CTRL + F », nous mettons « ^$ » (Circonflexe + Dollar) dans le champ de recherche et rien du tout dans le champ de remplacement, avant d’appuyer sur le bouton « Tout remplacer ».

Magique ! Sauf que… (voir ci-après.)

Suppression des paragraphes « Presque » vides.

Sauf qu’avec l’exemple de la page Web du conseil général, il reste des paragraphes vides… Enfin pas vraiment vides car à y regarder de plus près, les marques de paragraphes sont précédées d’un point qui signifie « Espace ». De plus, ces espaces peuvent être simples ou insécables, elles ne réagiront pas de la même façon en « Recherche – Remplacement ».

Les espaces insécables sont reconnaissables au fond gris qui apparaît si on a coché – comme conseillé au début de l’article – « Trame de fond des champs » dans le menu affichage.
Ici, nous allons donc ruser en recherchant tous les sauts de paragraphes précédés d’un et un seul caractère, quel qu’il soit.

Dans le champ de recherche, nous plaçons « ^.$ » (Circonflexe + Point + Dollar) (En expression régulière, le point signifie « N’importe quel caractère, une seule fois ».) Dans le champ de remplacement nous ne mettons rien et l’appui sur le bouton « Tout remplacer » finit de nettoyer le document des saut de paragraphes intempestifs.

Typographie

Suppression des répétitions d’espaces ou de tabulations

Espaces et tabulations n’ont pas vocation à être doublées. On apprend cela dans les bases du traitement de texte, mais nombre de personnes ont gardé de mauvaises habitudes issues du temps de la machine à écrire.
L’inconvénient majeur est qu’en cas de changement de police ou de taille, la mise en page risque d’être complètement déformée.

En survolant le document importé, nous allons regarder s’il y a des successions de points ou de flèches de tabulations – ce n’est pas le cas dans notre exemple – et nous allons utiliser la recherche remplacement pour faire le nettoyage.

Pour les espaces, nous mettrons dans le champ de recherche deux espaces à suivre (rien ne s’affiche dans le champ, c’est normal) et une seule espace dans le champ de remplacement. Il nous faudra répéter plusieurs fois cette opération car si on avait par exemple au départ une série de 18 espaces, après le premier passage de « recherche – remplacement », il en resterait 9, puis 5 après le second tour, puis 3, puis 2, puis une seule.

Concrètement, on appuie plusieurs fois sur « Tout remplacer » jusqu’à ce qu’un message nous dise que les termes cherchés n’existent pas.

On pratique de la même façon pour les tabulations, à ceci près que dans le champ de recherche on place « \t\t » puis « \t » dans le champ de remplacement. (Sans les guillemets bien sûr.)

Vérification de la typographie

La « Recherche – Remplacement » pourrait aussi être utilisée pour vérifier la conformité du document aux règles de typographie. On pourrait par exemple vérifier la présence des espaces insécables avant les « : » ou « ? ». Pour cela, on pourrait insérer systématiquement une espace insécable, puis rechercher les doubles espaces insécables afin de n’en garder qu’une, sans oublier de rechercher la suite « Espace – Espace insécable » pour ne conserver que l’espace insécable, le tout pour les caractères « : », « ; », « ! », « ? » et les guillemets.

Mais ceci est assez laborieux et nous verrons dans un autre article qu’il existe des macros pour réaliser ce travail.

Gestion des styles

Application du style « Corps de texte » par défaut

Nous allons maintenant tout sélectionner puis appliquer le style corps de texte à l’ensemble du document.

On accède à ce style par la liste déroulante des styles dans la barre d’outils de formatage.

Par défaut, comme on le voit ci-contre, le style est « Standard » c’est à dire qu’il ne prévoit pas d’espaces entre les paragraphes. Choisissons « Corps de texte » qui est beaucoup plus lisible.

Ensuite – avec le texte entièrement sélectionné – on applique à nouveau le formatage par défaut (Menu Format / Formatage par défaut), pour avoir un texte uniforme, sans enrichissements (ni caractères gras, ni italiques, ni couleurs…)

Reconstruire les titres

Pour finir, nous reconstruisons les titres en nous positionnant dessus un par un et en appliquant le niveau de titre adéquat dans la liste déroulante des styles.

IMPORTANT !

Ne pas choisir le niveau de titre en fonction de son aspect mais uniquement en fonction de son ordre hiérarchique. Si l’aspect d’un certain niveau de titre ne convient pas, nous pourrons toujours le modifier de façon globale par la suite.

Gérer les images

La gestion des images est assez déroutante. Celles-ci ont fâcheuse tendance à disparaître toutes seules au moment ou en a besoin. La plupart du temps, les images ne sont que des liens vers une adresse Internet sur laquelle elles sont stockées. Aussi, disparaissent-elles dès que la connexion est coupée. Nous verrons aussi qu’à l’intérieur même de notre document texte Writer, les images peuvent disparaître.

Je vous conseille donc de supprimer sans état d’âme toutes les images de votre document – comme pour les sections, le navigateur vous sera très utile pour cela – et de retourner sur la page Internet pour aller chercher les images qui vous conviennent.
Pour cela, « clic-droit / Enregistrer l’image sous… » ou plus facile encore, un simple glissé de l’image sur le bureau…

Ensuite, il ne faut surtout pas glisser l’image du bureau vers le document OpenOffice.org car dans ce cas seul un lien serait copié et dès que l’image ou le document auraient été déplacés l’un par rapport à l’autre, l’image disparaîtrait du document.

C’est uniquement à partir du menu « Insertion / Image / A partir d’un fichier… » que l’on peut être certain de réellement intégrer l’image dans le document OOo (encore ne faut-il pas cocher sur la case « Lien » dans la fenêtre « Insérer une image »).

Maintenant, il faut avoir conscience de l’intérêt de placer des images en dur ou en lien dans notre document OpenOffice.org. En lien, elles disparaissent facilement si on n’a pas une gestion rigoureuse du positionnement relatif du document et des images. En dur, le poids du document OpenOffice.org risque de croître très vite, pénalisant sa vitesse d’ouverture ou de traitement. Sachez par exemple que si vous placez une photo de 3 Mo dans le document, ce dernier verra sa taille augmenter d’autant, même si vous réduisez l’image avec les poignées vertes.

Dans le cas qui nous intéresse, à savoir le copier-coller depuis Internet, on sait que le poids des images est le plus souvent très faible et il est donc opportun d’inclure les images en dur. (A surveiller quand même on peut trouver sur Internet des images très lourdes qu’il conviendra alors d’optimiser (par exemple avec Irfanview).

Faute d’orthographe, paragraphe incompréhensible, ou si cet article vous a été utile, merci de laisser un commentaire.

Répondre

Vous pouvez utiliser ces tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>