Shift+Ctrl+P to save text screen dump with all attrs to ~/f2l_screen.dump in wx backend#3304
Shift+Ctrl+P to save text screen dump with all attrs to ~/f2l_screen.dump in wx backend#3304unxed wants to merge 1 commit intoelfmz:masterfrom
Conversation
…dump in wx backend. Useful for debugging with LLMs as LLMs are currently parsing colors in graphic screnshot not so well.
|
О, спасибо, сори что пришлось за мной доделывать - отвлекся ща на другие штуки. Дойду до компа - гляну. Оно же там не пишет цвет отдельно для каждой клеточки одинакового цвета в ряду, да? |
|
в целом там кстати уже есть инфраструктура для тестов, см testing, там есть функционал и чтобы читать экран, просто както не зашло.. |
|
Ой, html оч многословный получается, быстро токены пожжот, если в модельки скармливать.
А я кстати недавно посмотрел её, там прикольно, да. Я бы туда напихал 20+ (уже готовых) тестов для word wrap (штука сложная, писалась нейронками, нужно хорошее покрытие), но не решил, как такое количество раскидать между файлами, чтоб следовать принятой практике и не заспамить там всё |
|
в принципе наверное можно и еще компакнее - делать span внутри span-а, но там уже думать надо |
|
Кстати можно еще закрывающие теги выкидывать - оно тогда считает их всех вложенными. |
хаха, шел 2026й год, но нарисовать псевдографику без дырок могут не только лишь все |
|
Сделал вложенные span-ы, если что они там закрываются для приличия, но в принципе нет объективных причин это делать. Так что прижелании можно повыкусывать < /span > из вывода чтобы сэкономить токены |
|
вот это достает html из клипборда: |
|
Модельки "видели" мильон html'ок, они хорошо его читают. А вот над моим кастомным форматом им как раз надо думать. Так что может и норм будет, попробуем - поглядим! |
|
В принципе есть еще вариант RTFа, но я глянул быстренько как оно там - надо заводить палитру вначале документа и потом на нее ссылаться.. Даже не знаю будет ли это компактнее чем HTML, но вот кода для генерации RTF придется точно больше написать чем для HTML. |
|
Думаю нейронки видели существенно больше html чем rtf :) |
|
Тут просто какая штука. Растровые скрины даже в режиме максимального разрешения токенизатора сетки жрут плохо. У них на входе в итоге скорее смысловое описание картинки (не всегда точное), чем картинка. А чтоб ловить например мелкие баги рендеринга, достаточно скучные чтоб возиться с ними полностью вручную, надо как-то делать так, чтоб сетка видела именно четкий контент каждый ячейки. А дальше подбирать формат по сочетанию компактности и массовости. |
|
А что, всё-таки, скажете по поводу тестов, будет ок если я штук двадцать только для одного wordwrap'а сделаю? Одним файлом лучше или несколькими? Понятно, что эти штуки ещё кучу всего по дороге тестить естественным образом будут, так что их полезность word wrap'ом не ограничится. |
да как удобнее, пока это на стадии прототипа по сути |









Useful for debugging with LLMs as LLMs are currently parsing colors in graphic screnshots not so well