18.7 Zeichenweise Lesen und Schreiben – putc/fputc und getc/fgetc
 
Die Funktionen getc() und fgetc() sind das dateiorientierte Gegenstück zu getchar(). Sie werden verwendet, um einzelne Zeichen aus einem Stream zu lesen, der zuvor mit fopen() geöffnet wurde. Der Unterschied zwischen getc() und fgetc() liegt darin, dass fgetc() als eine Funktion implementiert ist und getc() ein Makro sein darf. Hier die Syntax dazu:
#include <stdio.h>
int getc(FILE *datei);
int fgetc(FILE *datei);
Folgende beiden Schreibweisen sind dabei identisch:
// liest ein Zeichen aus der Standardeingabe
getchar();
// liest ebenfalls ein Zeichen aus der Standardeingabe
fgetc(stdin);
Dazu folgt ein Listing, welches eine Datei zum Lesen öffnet und anschließend den Inhalt der Datei Zeichen für Zeichen auf dem Bildschirm ausgibt. Eingelesen wird so lange, bis das Zeichen für Dateiende oder Fehler erreicht wird (EOF).
/* fgetc1.c */
#include <stdio.h>
#include <stdlib.h>
int main(void) {
int c;
FILE *datei;
datei=fopen("test.txt", "r");
if(datei != NULL) {
while( (c=fgetc(datei)) != EOF)
putchar(c);
}
else {
printf("Konnte Datei nicht finden bzw. öffnen!\n");
return EXIT_FAILURE;
}
return EXIT_SUCCESS;
}
Bei diesem Programm wird zuerst versucht, eine Textdatei im Lesemodus zu öffnen. Falls dies gelungen ist, wird der Text zeichenweise ausgelesen mit
while( (c=fgetc(datei)) != EOF)
und mit putchar() zeichenweise auf dem Bildschirm ausgegeben, bis ein Fehler oder EOF auftritt. Das Programm soll ein wenig erweitert werden:
/* fgetc2.c */
#include <stdio.h>
#include <stdlib.h>
void read_char(FILE *stream) {
int c;
while( (c=fgetc(stream)) !=EOF)
putchar(c);
}
int main(int argc, char **argv) {
FILE *datei;
char filename[255];
/* Falls die Datei zum Öffnen nicht
* als Argument übergeben wurde ... */
if(argc < 2) {
printf("Welche Datei wollen sie öffnen : ");
scanf("%s",filename);
datei = fopen(filename ,"r");
if(datei != NULL)
read_char(datei);
else {
printf("Fehler beim Öffnen von %s\n",filename);
return EXIT_FAILURE;
}
}
else {
datei=fopen(argv[1],"r");
if(datei != NULL)
read_char(datei);
else {
printf("Konnte %s nicht öffnen!\n",argv[1]);
return EXIT_FAILURE;
}
}
return EXIT_SUCCESS;
}
In diesem Beispiel kann die Datei, die es zu öffnen gilt, über die Kommandozeile eingegeben werden oder erst nach dem Start des Programms. Es empfiehlt sich, diese Schreibweise allgemein für Konsolenprogramme zu verwenden. Damit ist zumindest sichergestellt, dass auch Anwender, die mit dem Programm nicht vertraut sind, es bedienen können.
Als Nächstes das Gegenstück der Funktionen getc() und fgetc(). Für die beiden Funktionen putc() und fputc() gilt hinsichtlich ihres Unterschieds dasselbe wie bei getc() und fgetc(). fputc() ist somit als Funktion implementiert, und putc() darf ein Makro sein. Mit putc()/fputc() kann zeichenweise in einen Stream geschrieben werden. Die Syntax dieser Funktionen lautet:
#include <stdio.h>
int putc(int quellen, FILE *ziel);
int fputc(int quellen, FILE *ziel) ;
Damit wird das Zeichen quelle in den Stream ziel geschrieben. Der Rückgabewert ist das Zeichen in quelle oder bei Fehler bzw. Dateiende EOF.
Dazu ein Listing, mit dem Sie eine Datei zeichenweise kopieren können:
/* copy_char4char.c */
#include <stdio.h>
#include <stdlib.h>
int main(void) {
FILE *quelle, *ziel;
int c;
char name_q[255], name_z[255];
printf("Name Quelldatei : ");
scanf("%s",name_q);
quelle=fopen(name_q,"rb");
if(quelle == NULL) {
printf("Konnte %s nicht finden bzw. öffnen!\n",name_q);
return EXIT_FAILURE;
}
else {
printf("Name Zieldatei : ");
scanf("%s",name_z);
ziel=fopen(name_z,"w+b");
if(ziel==NULL) {
printf("Konnte Zieldatei nicht erzeugen!\n");
return EXIT_FAILURE;
}
else {
/*Wir kopieren zeichenweise von quelle nach ziel */
while( (c=getc(quelle)) != EOF)
putc(c,ziel);
}
}
return EXIT_SUCCESS;
}
In diesem Beispiel werden zwei Streams verwendet – einer, mit dem die Datei geöffnet wird, um daraus zu lesen, und ein zweiter, mit dem in eine weitere geöffnete Datei geschrieben wird:
FILE *quelle, *ziel;
Passend werden diese Streams quelle und ziel benannt. Zuerst wird eine Datei zum Lesen im "rb"-Modus geöffnet. Anschließend erfolgt eine Abfrage, wie die Zieldatei heißen soll. Falls die Zieldatei nicht existiert, wird diese erzeugt. Andernfalls wird diese Datei einfach überschrieben, da der Modus "w+" verwendet wurde. Hier wird außerdem der binäre Modus eingesetzt, da der Inhalt in diesem Fall beim Kopieren nicht von Interesse ist. Unter UNIX/Linux hat das b für den Binärmodus keine Bedeutung und wird somit ignoriert:
ziel = fopen(name_z, "w+b");
Anschließend wird überprüft, ob die Datei zum Schreiben im Binärmodus geöffnet werden konnte. Danach kann zeichenweise von der Quelldatei gelesen und in die Zieldatei geschrieben werden:
while( (c=getc(quelle)) != EOF)
putc(c,ziel);
Wenn alles problemlos verlaufen ist, wurde eine exakte Kopie der Quelldatei erstellt mit dem Namen, der als Zieldatei angegeben wurde.
Dazu ein weiteres Beispiel, wann eine zeichenweise Abarbeitung von Daten sinnvoller erscheint. Jeder, der an einer Webseite arbeitet, kennt das Problem: Viel Text muss ins HTML-Format konvertiert werden. Wird dabei einmal das Zeichen '<' vergessen, welches einen HTML-Tag eröffnet, ist manchmal der vollständige Text bis zum nächsten mit '>' schließenden Tag futsch.
Das folgende Programm soll alle Sonderzeichen ins HTML-Format konvertieren. Folgende Regeln gelten:
Ersetze das Zeichen ä durch die Zeichenfolge ä
Ersetze das Zeichen Ä durch die Zeichenfolge Ä
Ersetze das Zeichen ö durch die Zeichenfolge ö
Ersetze das Zeichen Ö durch die Zeichenfolge Ö
Ersetze das Zeichen ü durch die Zeichenfolge ü
Ersetze das Zeichen Ü durch die Zeichenfolge Ü
Ersetze das Zeichen ß durch die Zeichenfolge ß
Ersetze das Zeichen < durch die Zeichenfolge <
Ersetze das Zeichen > durch die Zeichenfolge >
Ersetze das Zeichen & durch die Zeichenfolge &
Ersetze das Zeichen " durch die Zeichenfolge "
Hier der Quellcode dazu:
/* txt2html_example.c */
#include <stdio.h>
#include <stdlib.h>
/* nchars = Anzahl der Zeichen */
/* tag = Sonderzeichen in HTML */
/* ziel = Datei, in die geschrieben wird */
void sonderzeichen(int nchars, char *tag, FILE *ziel) {
int i;
char zeichen;
for(i = 0; i < nchars; i++) {
zeichen = tag[i];
putc(zeichen, ziel);
}
}
int main(int argc, char **argv) {
FILE *q, *z;
int zeichen;
if(argc < 3) {
printf("Benutzung : %s quelle ziel\n", *argv);
return EXIT_FAILURE;
}
q = fopen(argv[1], "r");
z = fopen(argv[2], "w");
if(q == NULL || z == NULL) {
printf("Fehler bei Oeffnen einer Datei ...\n");
return EXIT_FAILURE;
}
while((zeichen=getc(q)) != EOF) {
if(zeichen=='<')
sonderzeichen(4,"<", z);
else if(zeichen=='>')
sonderzeichen(4,">", z);
else if(zeichen=='\"')
sonderzeichen(6,""",z);
else if(zeichen=='&')
sonderzeichen(5,"&",z);
else if(zeichen=='ä')
sonderzeichen(6 ,"ä",z);
else if(zeichen=='Ä')
sonderzeichen(6 ,"Ä",z);
else if(zeichen=='ö')
sonderzeichen(6 ,"ö",z);
else if(zeichen=='Ö')
sonderzeichen(6 ,"Ö",z);
else if(zeichen=='ü')
sonderzeichen(6 ,"ü",z);
else if(zeichen=='Ü')
sonderzeichen(6 ,"Ü",z);
else if(zeichen=='ß')
sonderzeichen(6 ,"ß",z);
else
putc(zeichen, z);
}
return EXIT_SUCCESS;
}
Schon wurde mit ein paar Zeilen Code ein Text2Html-Konverter in einer Light-Version geschrieben.
|