2016-03-29 7 views
0

Ich habe ein PDF-Dokument in Ruby mit PDF :: Reader analysiert. Der Aufzählungspunkt der PDF-Datei erscheint in meinem analysiert Text als seltsam Würfel mit F0B7 innen wie folgt aus (ich auch einen Druck-Bildschirm angeschlossen ist):Ruby PDF :: Leser zusammenpassenden Aufzählungspunkt mit Regex

__ 
|F0| 
|B7| 

Ich mag würde wissen, ob ich dieses „Aufzählungspunkt bieten kann "mit Regex und wenn ja, was wäre der geeignete Weg, es zu tun? Ich habe absolut keine Idee, dieses Problem anzugehen, da ich mir nicht einmal sicher bin, ob dies überhaupt Teil der Saite ist. Vielen Dank. enter image description here

Antwort

0

Dies ist ein Unicode-Symbol mit codepoint F0B7.

Leider hat Ihre Ubuntu-Installation eine Standardschriftart, die diese Glyphe vermisst, und wenn Glyphe in der Schriftartdefinition fehlt, ist der gemeinsame Ansatz, seinen Codepoint in einem Quadrat zu zeichnen.

Die regexp übereinstimmen, es wäre:

/\uF0B7/ 

enter image description here