Ремесло программиста

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » Ремесло программиста » Русский язык в ИТ » Википедия - это непаханное поле


Википедия - это непаханное поле

Сообщений 1 страница 19 из 19

1

Перевожу очередную статью из английской Википедии. В английской Вики есть интересующий меня материал, а в русской - нет. В небольшой, в общем-то, статье обнаружил как минимум десяток статей, отсутсвующих в русской Вики. Казалось бы - бери и пиши! Кто первый встал - того и тапки! Не буду показывать пальцем на людей, которые правили Википедию на свой манер. Но его редакторы одёргивали ("нечего русские слова иностранного происхождения заменять русизмами"), что вызывало негодование: "Русские люди - против русского языка?! Такие-сякие википедики!".

Но к чему сражаться с ветряными мельницами? Пиши статьи в Википедию, переводи (английская Вики больше нашей в несколько раз), и, пользуясь правом первой ночи, утверждай свою терминологию. Но... Что-то нет таких порывов души... А жаль.

2

Может быть нужно предложить людям готовую методику (алгоритм действий)?

3

Да алгоритм простейший. Начинаешь копать интересную тему и выясняется, что на эту тему в нашей Вики ничего не написано, а вот в английской кое-что есть. Читал, я например, нашу Вики про язык Clean. Маловато мне показалось. Решил почитать, что пишут о нём на английском. И там встречаю пару интересных моментов, которые не описаны в русской Вики. Тогда беру и перевожу (кстати, переводчик Гугл умнеет очень быстро; это не то, что было много лет назад; некоторые предложения он переводит так, что я к ним даже не прикасался - и так всё хорошо) на русский машинными переводчиками. А плохо переведённые места перевожу сам (или уточняю перевод). Вот так появились статьи "UTF-32" (это было уже давно), "Типы, гарантирующие уникальность", "Ссылочная прозрачность" (недавно). В процессе перевода последней обнаружил, что в русской Вики отсутствуют следующие статьи:
Purely functional programming
Graph reduction
Persistent data structure
correctness
deterministic
name binding
statically bound
code motion
Начнёшь переводить любую из них - и столкнёшься с тем, что в статье есть ссылки, где опять же английская статья присутствует, а русская - отсутствует.

4

Я не об этом немного. Меня интересует введение новых терминов, которые не обозначены в русском языке.
1) Есть ли гарантии что данные вопросы не были освещены ранее? Википедия не показатель в этом плане. Что если существует большой пласт данных на эту тему? На каком-нибудь хабре например может быть устоявшиеся терминология. Где гарантии того, что Вы не введете термин повторно?
2) Есть ли показатели, определяющие корректность вводимого термина? Вот например в Вашей статье про типы гарантирующие уникальность - в том термине, который ввели Вы есть двойственность. С одной стороны Ваш перевод наиболее близко дословно переносит значение английских слов. С другой стороны, по моей личной оценке, смысл описываемого явления несколько отличен от представленного. Это очень личная субъективная оценка содержимого статьи и она абсолютно не претендует на правильность. Но что если прав я? Тогда Вы передадите неверные сведения, оценку достоверности которых можно будет определить только после большого количества материала на данную тему. И чем больше Вы будете переводить статей тем больше вероятность наступления данного события. Соответственно нужны какие-то критерии по-которым, можно было бы хотя бы как-то формально находить явные ошибки смысла (не перевода, я не сомневаюсь что дословный перевод на высоте). К сожалению имеется проблема перевода - слова в разных языках могут иметь различные смысловые оттенки. Иными словами некоторые предложения невозможно перевести дословно - содержимое будет изменено. Чем больше текст, тем больше проблем соответственно, что осложнено узкоспецифичной сферой вопроса.

5

Есть ли гарантии что данные вопросы не были освещены ранее? Википедия не показатель в этом плане.

Конечно, свет клином не сошёлся на английской Википедии. И на Хабре тоже. Но поскольку статью на эту тему в русской Википедии будете писать Вы, то Вы можете стать родоночальником термина. Например, слово "зловред" появилось позже термина "компьютерный вирус". Но ведь кто-то ввёл в оборот это слово.

в Вашей статье про типы гарантирующие уникальность - в том термине, который ввели Вы есть двойственность. С одной стороны Ваш перевод наиболее близко дословно переносит значение английских слов. С другой стороны, по моей личной оценке, смысл описываемого явления несколько отличен от представленного.

Как раз то я увидел неточность, двойственность терминов "уникальный тип" и "тип уникальности", которые являются калькой с английского. Это не соответствовало сути этих самых типов. Поэтому взял на себя смелость ввести термин, который лучше всего (на мой взгляд) соответствует смыслу описываемого термина.

слова в разных языках могут иметь различные смысловые оттенки. Иными словами некоторые предложения невозможно перевести дословно - содержимое будет изменено

Ну да, наш "контроль" и английский "control" - весьма разные. Такое наблюдается довольно-таки часто. Если в наш язык эти слова проникли, то заняли узкую, специфическую нишу профессиональных терминов. У них же эти слова - общеупотребительны и несут в себе широкий смысл.

Универсальных рецептов нет. Я, вводя термин "Типы, гарантирующие уникальность", испытывал сомнения. Посоветовался - и сомнения отпали. Думаю, советчиков Вы тоже найдёте.

6

Конечно, свет клином не сошёлся на английской Википедии. И на Хабре тоже. Но поскольку статью на эту тему в русской Википедии будете писать Вы, то Вы можете стать родоночальником термина. Например, слово "зловред" появилось позже термина "компьютерный вирус". Но ведь кто-то ввёл в оборот это слово.

Как быть уверенным что данное описание не определено под другими ключевыми словами. Например, Вы пишите "зловред", а где гарантии, что это слово уже не используется? И где гарантии что описываемое Вами понятие уже не было описано и ему не присвоено другое словосочетание? А специалисты им уже пользуются.

Поэтому взял на себя смелость ввести термин, который лучше всего (на мой взгляд) соответствует смыслу описываемого термина.

Вопрос не в конкретной статье (это пример), а вообще в вероятности явления.

Универсальных рецептов нет. Я, вводя термин "Типы, гарантирующие уникальность", испытывал сомнения. Посоветовался - и сомнения отпали. Думаю, советчиков Вы тоже найдёте.

Поэтому и нужна методичка :). Я найду, а кто-то решит, что таких советчиков нет или ему не нужны или вообще не придет мысль в голову.

7

Как быть уверенным что данное описание не определено под другими ключевыми словами.

А Гугл на что? Если человек заинтересован, то он найдёт способы...

Поэтому и нужна методичка

Я обошёлся без неё. Может, потому что мне хотелось? А если не хочется, то и методичка не поможет.

8

utkin написал(а):

С одной стороны Ваш перевод наиболее близко дословно переносит значение английских слов. <...> К сожалению имеется проблема перевода - слова в разных языках могут иметь различные смысловые оттенки.

Думается, выбрано неверное значение из списка.

Например, слово "зловред" появилось позже термина "компьютерный вирус". Но ведь кто-то ввёл в оборот это слово.

Но кто его использует? Словообразование сомнительное. Опять же, слово "зараза" лучше выражает суть. Из этих двух чаще используют именно последнее.

9

Думается, выбрано неверное значение из списка.

Откуда известно, какое значение верное?

Но кто его использует? Словообразование сомнительное. Опять же, слово "зараза" лучше выражает суть. Из этих двух чаще используют именно последнее.

Как это определить для специфических переводных терминов?

10

utkin написал(а):

Как это определить для специфических переводных терминов?

[html]Например у <a href="https://www.transifex.com/atlassian/bitbucketorg/translate/#ru/">Atlassian</a> к каждому проекту есть свой <a href="https://www.transifex.com/atlassian/bitbucketorg/glossary/ru/">словарь-глоссарий</a>. [/html]Там для каждого проекта отведена своя ниша определений. Каждый зарегистрированный пользователь имеет право предлагать свои переводы.

11

utkin написал(а):

Как это определить для специфических переводных терминов?

Специфические переводные термины появляются от того, что "переводчики" на самом деле - любители, не знающие толком русский язык, а программисты знают его обычно довольно плохо.
И да, на это надо потратить много времени. Разница м/у переводом и недопереводом по трудоёмкости - десятки раз.

12

MihalNik написал(а):

Специфические переводные термины появляются от того, что "переводчики" на самом деле - любители, не знающие толком русский язык, а программисты знают его обычно довольно плохо.

Несогласен.
К примеру из двух книг по качественному тексту  я выбираю вторую так как её написал программист.
Нора Г.-Слово живое и мертвое. Международные отношения (2001)
Г.П. Несговорова ПОСОБИЕ ПО НАПИСАНИЮ РАЗНОГО РОДА ДЕЛОВЫХ ТЕКСТОВ

Да и наш Юрий очень хорошо пишет.  Так что по моим наблюдениям программисты пишут лучше чем литераторы.
Но конечно лучше всех переводчики которых учат этому несколько лет. Их учат классифицировать слова и разделять по предметным областям. Заставляя изучать десятки словарей и читать тексты из разных предметных областей. Да и второй иностранный заставляет их думать о словах правильно.
Подбирая верные стыковочные слова. А если они ещё и психологи, то строят текст позволяя читателю самому додумывать мысль описанную через окружающие отсылки(контекст и колрефенци).

13

Специфические переводные термины появляются от того, что "переводчики" на самом деле - любители, не знающие толком русский язык, а программисты знают его обычно довольно плохо.
И да, на это надо потратить много времени. Разница м/у переводом и недопереводом по трудоёмкости - десятки раз.

Поэтому я и говорил, что нужна методика. Инструкция. Потому что среди специалистов по русскому мало программистов, а среди программистов мало тех кто отлично знает и русский и английский.

Да и наш Юрий очень хорошо пишет.

Потому что он нам ближе как программист. Одна волна. Если бы он переводил Шекспира, его бы закидали помидорами. Я об этой проблеме и пишу тоже. Нужен какой-то ориентир, маяк, чтобы переводить потоком и в тоже время грамотно.

14

utkin написал(а):

Поэтому я и говорил, что нужна методика. Инструкция. Потому что среди специалистов по русскому мало программистов, а среди программистов мало тех кто отлично знает и русский и английский.

В техническом письме да и в других областях  есть два понятия: верификация и валидация.
- Верификация это проверка на соответствие формальным требованиям. К примеру снижение числа стоп слов и слов паразитов.
- Валидация это проверка на пригодность к применению людьми. Текст должен пройти проверку на не подготовленных людях и они должны понять смысл написанного.  Если они не могут понять смысл то выдать свои замечания предложения.

Все естественные языки имеют разночтения и неточности.
Поэтому требование заменить многозначное слово однозначным строго говоря не формализовано. И врятли может быть.  Но мы писатели стремимся к этому.

Во-вторых неоднозначность трактовки приводит к обсуждению диалогу и спору. Как говорят в спорах рождается истесана. Так что инструкции должны быть не точными что-бы заставить людей думать. С другой стороны Хорошей литератор может сразу выдать качественный текст. Да и в следствие неоднозначности естественного языка  большинство правил не формализовано. Видимо поэтому  корректорам дают много воли на литературную правку не ограничивая их рамками.
Но правда большинство посредственностей мнят себя великими и начинают писать как им вздумается.
Поэтому должна быть мера оценки корректоров. Как в игре Го. Типо я Дан и могу применять литературную правку, а ты одноциферный кю  можешь применять только в черновиках. Так как у тебя ещё много ошибок. А если ты двуцифренный, то даже и не думай. Ибо разница между кю и даном в том что кю делает N-ошибок за один ход, столько у него цифр. А дан делает ошибку раз в N-ходов. N равно уровню.

У литераторов пусть будет не од, а одно предложение.

А определить кто из литераторов выиграл можно на верификации по скорости чтения и правильности ответа на вопросы.

В Го есть 10 основных правил. По аналогии можно ввести и для переводчиков и литераторов.
1) Основное понятие это темп. Если вы выбираете ход без потери темпа то вы побеждаете.
Для литераторов аналогом темпа является связанность предложений. Она должны быть не только не столько логическая. Сколько смысловая и лексическая
- как у Чехова.
2)Вначале самый большой ход.  В начале предложения пишем общими словами в конце даём уточнения. - В пособии это есть.
3)

15

А где остальные правила :)?

С другой стороны Хорошей литератор может сразу выдать качественный текст

Таких литераторов как Юрий очень мало, поэтому будем считать что их как бы вообще нет и переложить проблему на чьи-то мужественные плечи не получится :).

Валидация это проверка на пригодность к применению людьми. Текст должен пройти проверку на не подготовленных людях и они должны понять смысл написанного.  Если они не могут понять смысл то выдать свои замечания предложения.

Проблема в том, что материал сложный и новый, фактически не встречающийся в русскоязычной литературе. Поэтому как определить человек не понял:
- потому что новый сложный материал?
- потому что переводчика надо пустить на мыло?

16

utkin написал(а):

А где остальные правила ?

Мало составить правила надо ещё научить их переменять.

3) Прежде чем девать сложный материал вначале сделайте текстовое пояснения основных принципов. Что-бы дать на них отсылки.

4) Если абзац выгладит не понятным. То стоит разделить его на несколько или во все выделить в отдельную главу.
Если текст понятен, то его можно записать таблицей кратко.

utkin написал(а):

- потому что новый сложный материал?
- потому что переводчика надо пустить на мыло?

Переводчик не должен один в один писать. Он должен пересказывать.  Так что если есть сложные моменты то он должен их упростить.
Если не путаю Эйнштейн сказал физику надо объяснять как можно проще, но не проще чем это возможно. Я уже давал ссылку где определяются стоп-слова.   Есть обще известные слова а есть термины. Так вот термины это и есть стоп-слова. И если их много то текст будет непонятным.

Как определить понял ли читатель материал или нет?  Без обратной связи никак.  Нужно предложить читателю решить задачу или ответить на вопрос. Причем вопросы могут быть разной сложности.
В этом году была шумиха по поводу ИИ типа он научился отвечать на вопросы лучше человека. Правда вопросы там были очень простые требовалось отметить ответ в готовом тексте.
А если помните то в старшей школе и в вузе есть ряд вопросов на самостоятельный анализ. Когда что-бы ответить  надо сопоставить факты из разных глав учебника. Не просто заучить ответы но ещё найти ту тонкую грань которая отделяет одну проблематику от другой.

Анализ и классификация это вопросы повышенной трудности. - они проверяют сложность материала.
Вопрос на память и пересказ своими словами проверяют на сколько верно человек понял материал, и тут как раз проверяется качество переводчика насколько он хорошо подобрал слова на сколько хорошо они попадают в ассоциативную память читателей.
Есть книга Язовицкий Е.В. Говорите правильно Эстетика речи_1969 она учит как раз как правильно попадать в ассоциативный ряд.

А тесты проверяют насколько читатель внимательно прочитал текст. Так же это сигнализирует вернее коррелирует с наличием и отсутствием стоп-слов. Если писатель выбрал слова которые похожи до смешения, то читатель может воспринять текст не верно. Соответственно  такую неоднозначность надо убирать. Проблема ИИ то что он не видит такой неоднозначности поэтому у него и получалось лучше читать.
Возможно тут поможет  СЛОВАРЬ СОЧЕТАЕМОСТИ СЛОВ РУССКОГО ЯЗЫКА Под редакцией П. Н. ДЕНИСОВА, В. В. МОРКОВКИНА - я его ещё не читал.

17

Как это обычно происходит. Автор написал текст. Текст даётся начальнику, а ещё лучше корректору который ничего не знает о предметной области. Ему не нужно вникать в суть. Он просто отмечает предложения которые ему непонятны.  Посмотрите любую структуру книжного бюро. Там текст проходит до 5 человек.  Автор  пишет как он думает затем текст передают техническому писателю или литературному рабу. Тот пересказывает своими словами. Затем текст отдаётся на вёрстку верстальщик тоже читаете текст и вносит правки. А сверху текст смотрит корректор который вообще не ведает предметной областью.

Взять к примеру Тененбаума. Его первая книжка по ОС выглядела примерно также запутанно как 2-послених мои поста. Зато потом он начал печататься в нормальном издательстве. И разница между текстами колоссальная. 

Ещё можно вспомнить кучу семейных пар. Когда муж выступает автором, и проверяет свои творения на жене. А она пишет и корректирует текст. Или браться.
Стругацкии, Фроловы, Олиферы, Хэррисы, и тд.

18

Или давай ближе к переводчикам. Есть же колабараторные переводы. К примеру тут уже говорили о transifex.com/
Там есть много всего для улучшения перевода.  Есть люди которые могут предлагать перевод. Есть переводчики которые выполняют перевод. А есть корректоры которые проверяют переводы и фиксируют их. Плюс есть ассоциативная память и словари проекта которая позволяет использовать один и тот же термин во всём тексте.
И для переводчиков есть ещё контекстная справка. Между прочим я на transifex.com так же участвую в ряде переводов. Где-то легко перевести. А где-то приходится и в гугл заглянуть посмотреть что значит фраза. Подобрать нужные замены.
Правда данная система больше предназначено для руководств и прочих табличных текстов. Она не позволяет делать пересказ абзацев, а только предложений.  Должна быть возможность укрупнить единицу перевода что-бы больше соответствовать русской литературной речи.

19

Дело же не только в переводе. Вики - энциклопедия. Можно описать явление своими словами, затем привести его к строгости словаря, сверить с материалом на другом языке и пополнить. Там и метки для соответствующих указаний есть - что перевод или что не соответствует энциклопедичности.
Это не обязательно должен делать один человек. В первую очередь нужно именно понятное описание - тогда текст смогут дорабатывать другие, даже не специалисты в предметной области.


Вы здесь » Ремесло программиста » Русский язык в ИТ » Википедия - это непаханное поле