Τα αρχεία PDF είναι εκ' φύσεως αρχεία "εγγράφων": η διάταξη είναι υπό τη μορφή των σελίδων. Το περιεχόμενο πρέπει επίσης να υπάρχει με εναλλακτικές μορφές όπως η μορφή συνεχής ροής. Οι πιο συνηθισμένες περιπτώσεις μορφών συνεχής ροής περιλαμβάνουν::
Η ανακατασκευή για αυτές τις περιπτώσεις χρήσης, εστιάζει περισσότερο στη δομή του εγγράφου από ό,τι στην διάταξη και την μορφοποίηση. Για παράδειγμα, πρέπει να ληφθούν αδόμητα αρχεία PDF και να αναγνωριστούν στήλες, πίνακες, λίστες, κεφαλίδες και υποσέλιδα, κλπ. Αυτό μας επιτρέπει να οργανώσουμε το περιεχόμενο με μια λογική δομή. Σε τελική ανάλυση, θα αναγνωριστούν θέματα και τμήματα έτσι ώστε να μπορέσουμε να παράγουμε λογικές ιεραρχικές δομές από απλά μη επισημασμένα (non-tagged) αρχεία PDF.
Εκεί που μπορείτε να καταλάβετε ότι οι συμβατικές σελίδες PDF δεν είναι και ο πιο κατάλληλος τρόπος για να διαβάσετε ένα έγγραφο, είναι σε σχετικά μικρές οθόνες των φορητών συσκευών. Για παράδειγμα, η τυπική Blackberry έχει 3"x2" οθόνη με ανάλυση περίπου 320x240 pixels
Σε αυτό το διάγραμμα τα μικρά ορθογώνια εκπροσωπούν την περιοχή προβολής σε μία συσκευή Blackberry κατά την ανάγνωση ενός εγγράφου που απεικονίστηκε σε 8.5 "x11" σελίδες.
Για 100% μεγέθυνση έχουμε περίπου 100 pixel ανά ίντσα. Σκεφτείτε ανάλυση σαρωτή κακής ποιότητας.
Για 50% μεγέθυνση θα έχουμε μια απλή ανάλυση 50 pixel ανά ίντσα που είναι χειρότερη από σαρωτή κακής ποιότητας. Ωστόσο, λόγω της διάταξης, θα πρέπει να μετακινείτε το "παράθυρο" της οθόνης σας, αριστερά-δεξιά και πάνω-κάτω για να δείτε όλη τη σελίδα. Με ή χωρίς στήλες, όλες αυτές οι μετακινήσεις για να διαβαστεί μία σελίδα είναι αρκετά κουραστικές.
Υπάρχει ήδη μια πολύ καλύτερη διάταξη για την ανάγνωση εγγράφων σε χαμηλότερη ανάλυση. Αυτή η μορφή είναι η HTML. Στην δεκαετία του 90, όταν το διαδίκτυο άρχισε να γίνεται δημοφιλές για την περιήγηση στο Web, η ανάλυση της οθόνης για desktop υπολογιστές ήταν περίπου ίδια με την ανάλυση των φορητών συσκευών σήμερα. Ακόμη και με ανάλυση 640x480 pixel στις οθόνες των φορητών συσκευών, το φυσικό μέγεθος τους (συνήθως 3"x2") εξακολουθεί να είναι βασικός περιορισμός.
Εάν υποτεθεί ότι κάποιος μπορεί να ανακατασκευάσει τα αρχεία PDF σε έγγραφα συνεχής ροής, τότε το επόμενο βήμα θα είναι να τα μετατρέψει σε HTML. Αν η συσκευή είναι φορητή, τότε η πολυπλοκότητα της HTML θα πρέπει να περιοριστεί στο ελάχιστο. Αυτό σημαίνει απλοποίηση των γραμματοσειρών, με τη χρήση CSS για το στυλ και τη χρήση στοιχείων HTML που δείχνουν τέλεια ακόμη και στο πιο απλό πρόγραμμα περιήγησης. Με βάση τα πειράματα που έχουμε κάνει είδαμε ότι η XHTML 1.0 υποστηρίζεται καλά από τα προγράμματα προβολής HTML στις περισσότερες φορητές συσκευές.
Για να δείτε πόσο καλά λειτουργεί η μετατροπή αρχείων PDF σε HTML, μπορείτε να πειραματιστείτε στο www.pdf2mobile.com χωρίς να χρειάζεστε καμία φορητή συσκευή.
Στη συνέχεια, θέλουμε να είναι πραγματικά εύκολο στη χρήση από οποιαδήποτε φορητή συσκευή. Ας υποθέσουμε ότι λαμβάνετε ένα email στο Blackberry σας με ένα συνημμένο έγγραφο PDF, απλά προωθήστε το στην παρακάτω διεύθυνση .
Η υπηρεσία θα το μετατρέψει σε HTML και θα σας το στείλει με email. Διαφορετικά, εάν έχετε μια φορητή συσκευή με πρόγραμμα προβολής που αποδέχεται ενσωματωμένη μορφή HTML τότε μπορείτε να προωθήσετε το email σας στο και θα σας επιστραφεί ως ενσωματωμένο HTML email και όχι σαν συνημμένο HTML αρχείο.
Μας ενδιαφέρουν τα σχόλιά σας () για τη μετατροπή και την μορφή HTML. Αυτή η λειτουργία μετατροπής αρχείων PDF σε HTML θα είναι διαθέσιμη για επιχειρησιακές διεργασίες χρησιμοποιώντας Solid Framework SDK.