Eine sequenzielle Dataset in SAS komprimieren
Die SAS "KOMPRIMIEREN =" Optionen "squeeze-out" und entfernen Sie die Leerzeichen aus Datasets zu Beobachtungen an zwei oder drei Bytes-Vertretungen und verringern die Gesamtdateigröße des Datasets. Zwei Methoden der sequenziellen Dataset Kompression Auftritt in SAS: innerhalb von "Daten" oder "OUT =" Prozedur Schritt oder auf Systemebene. Datenkomprimierung Schritt SAS komprimiert Zeichendaten in eine einzelne Datentabelle. System-Komprimierung reduziert die Größe aller neu erstellten Datasets.
Anweisungen
Datensatzebene
1 Das SAS-Programm mit dem SAS-Programm-Editor zu öffnen. Suchen Sie das einzelne Dataset in der Kompression angewendet.
2 Tragen Sie die KOMPRESSE = Option innerhalb der Output DATA-Anweisung, mit der folgenden Syntax:
Daten MyTestSet (KOMPRIMIEREN = YES);SET MyInitialSet;AUSFÜHREN;
3 Tragen Sie die KOMPRESSE = Option in der "OUT =" Option einer SAS-Prozedur mithilfe der folgenden Syntax:
PROC SORT DATA = MyInitialSet OUT = MyTestSet (KOMPRIMIEREN = YES); VON id1; AUSFÜHREN;
4 Führen Sie die Programmlinien. Überprüfen Sie die SASLOG für die Ergebnisse von den Daten oder SAS Prozedur Schritt.
Systemebene
5 Das SAS-Programm mit dem SAS-Programm-Editor zu öffnen.
6 Tragen Sie die KOMPRESSE = Option innerhalb der globalen Ebene an der Spitze des Programms innerhalb einer "Optionen"-Anweisung, mit der folgenden Syntax:
OPTIONEN COMPRESS = YES;
7 Führen Sie die Programmlinien. Überprüfen Sie das SAS-Protokoll nach einem Daten-Schritt zu überprüfen, ob die Komprimierung stattgefunden hat.
Tipps & Warnungen
- Die KOMPRESSE = Option funktioniert effektiv für große Datenmengen und Typs Zeichendaten. Lesen Sie die Anmerkung in der Ausgabedatei SASLOG zu ermitteln, ob die-Verkleinerung die Komprimierungsoptionen rechtfertigen und des SAS-Programms entsprechend Anpassungen.
- Betrachten Sie, wie häufig das komprimierte Dataset zugegriffen werden soll, vor der Anwendung von Kompression. Während Kompression Dateigrößen verringern kann, kann es auch zusätzliche CPU-Zeit zum Prozess sowie zusätzliche Zeit, um Code in das Programm verlangen.