برای ترجمه اسناد PDF اسکن شده در SDL Trados Studio باید به چه نکاتی توجه کنیم؟

بازدید: 1769 بازدید

اگر مترجم باشید طبیعتا با انواع فرمت های کامپیوتری سروکار خواهید داشت که پشتیبانی شدن فایل مبدا پروژه توسط نرم افزار مدیریت پروژه های ترجمه یکی از مهمترین ویژگی های این نرم افزارها می باشد.

برای ترجمه فایل های PDF مهم ترین نکته ای که باید به آن توجه داشته باشید کیفیت فایل مبدا می باشد، برای مثال اگر فایل اسکن تصویری از کتاب می باشد طبیعتا باید دارای عمق تصویر مناسبی باشد تا با OCR نرم افزار ترادوس بتوانید جملات و پاراگراف ها را شناسایی و تبدیل به متن قابل ویرایش کنید.

خوشبختانه در زمینه متون انگلیسی مشکل چندانی نداریم زیرا اکثر متون انگلیسی از روی نسخه word یا epub تبدیل به PDF شده اند و اکثر نرم افزارهای OCR خوان قابلیت شناسایی فونت های انگلیسی در متون را دارند، از این رو کار کردن روی این دسته از فایل ها آسان تر می باشد.

نکته بعدی در خصوص متون انگلیسی این است که ممکن است به پروژه ای برخورد کنید که دارای پاراگراف های چند ستونه باشد و ادامه هر پاراگراف در ستون بعدی آمده باشد.

در این شرایط نرم افزار SDL Trados Studio ممکن است در تشخیص ابتدا و انتهای هر جمله یا پاراگراف دچار اشتباه شود که طبیعتا در زمان ترجمه هم دچار مشکل خواهید شد. مشکل دیگری که در هنگام کار با فایل های PDF بی کیفیت زیاد با آن برخورد خواهید کرد مربوط به جا افتادن برخی از کلمات و جملات پایانی انتهای صفحات باشد که به دلیل کیفیت پایین امری کاملا طبیعی است.

در این خصوص چندین بار با OCR شرکت گوگل در سرویس گوگل درایو به مشکل برخورد کردم چون پس از آزمایشات متعدد نتوانسته بود ادامه جملات را تشخیص دهد و جملات روبروی هم را به عنوان یک پاراگراف درنظر می گرفت اما OCR نرم افزار ترادوس استودیو به سادگی از پس آن برآمد.

چاره حل این مشکل هم فقط با پیدا کردن نسخه با کیفیت فایل مبدا تا حدودی برطرف می شود اما برای هر پروژه نمی توان به جستجوی نسخه با کیفیت آن رفت از این رو نرم افزار مدیریت پروژه ترجمه که در اینجا از نرم افزار SDL Trados Studio استفاده می کنیم باید دارای قابلیت های بیشتری برای این دسته از فایل ها باشد.

نکته جالبی که در کار با نرم افزار مدیریت پروژه ترجمه SDL Trados Studio برخورد خواهید کرد این است که نرم افزار ترادوس کار تبدیل فایل مبدا از فرمت PDF به فایل Word را به صورت خودکار انجام خواهد داد.

اما در برخی از موارد ممکن است این نرم افزار موفق عمل نکند از این رو برای تبدیل فایل های PDF پیشنهاد می کنم که از نرم افزار Adobe Acrobat DC یا Foxit PhantomPDF استفاده کنید زیرا بهترین نتیجه ممکن را از خروجی فایل خود خواهید گرفت.

از بین دو نرم افزار فوق طبق بررسی های عملی در حین انجام پروژه ها به قدرت بدون شک نرم افزار Foxit PhantomPDF نسبت به نرم افزار شرکت Adobe پی بردم. نکته جالب اینجاست که نرم افزار Foxit PhantomPDF امکان دریافت خروجی کامل برخی از فایل های فارسی را هم داراست.

باید سعی کنید که فایل PDF پروژه تان قابلیت ویرایش را داشته باشد و محدودیت یا قفلی روی آن نباشد تا قابلیت OCR نرم افزار SDL Trados Studio بتواند کل متن را استخراج کند.

تنظیمات بخش OCR در نرم افزار SDL Trados Studio جهت اسکن فایل های PDF

در نرم افزار ترادوس استودیو سه حالت برای تشخیص نوع نوشتار در فایل های PDF وجود دارد که می توانید از مسیر زیر در نرم افزار ترادوس به آن دست پیدا کنید:

File > Options > File Types > PDF >

این سه حالت عبارتنداز:

Every character – برای PDFهایی طراحی شده است که هم حاوی نوشتار قابل ویرایش و هم نوشتار اسکن شده هستند.

Problem characters only – برایPDFهایی طراحی شده است که کاملاً نوشتار آنها اسکن شده است.

None – برایPDFهایی طراحی شده است که نوشتارشان قابل ویرایش است.

همچنین می‌توانید سایر تنظیمات مربوط به تبدیل فایل PDF از جمله “چیدمان”، “بازیابی تصویر”، “سربرگ و پاورقی” و “تشخیص جدول” را نیز پیکربندی کنید.

برای آن که بدانید کدام یک از گزینه‌ها برای شما مناسب‌تر است، شاید بد نباشد که گزینه‌های مختلف را امتحان کنید.

تفاوت بین اسناد PDF قابل ویرایش و غیرقابل ویرایش در چیست؟

مهمترین تفاوت این فایل ها را می توان در زمان استخراج متون توسط نرم افزارهای OCR خوان دانست به این صورت که برخی از فایل ها توسط نویسنده یا مولف یا تولید کننده فایل از نظر ویرایش،چاپ و… محدودیت دار می شوند.

حتی در برخی از موارد نمی توان متن را توسط ماوس انتخاب کرد البته این کار برای مترجمینی که از روش های قدیمی برای ترجمه پروژه ها بهره می برند اهمیتی ندارد و با باز نمودن فایل اقدام به ترجمه خط به خط فایل می کنند اما برای مترجمینی که به دنبال استفاده از هوش مصنوعی و پیشرفته در جهت پیشبرد سریعتر پروژه های محوله هستند این موضوع بسیار با اهمیت است که کلیه اسناد زبان مبدا قابلیت ویرایش را داشته باشد.

در نهایت دقت داشته باشید که هر چه فایل PDF با کیفیت تری داشته باشید خروجی دریافتی کیفیت بهتری خواهد داشت.

در صورتی که مترجم هستید و نمی دانید که نرم افزار مترجم یار SDL Trados Studio در انجام پروژه هایتان می تواند چه میزان تاثیرگذار باشد پیشنهاد می کنیم علاوه بر این مقاله، مقاله دیگری با عنوان چگونه پروژه های ترجمه را با SDL Trados Studio مدیریت کنیم؟ را مطالعه کنید.

در صورتی که تا حدودی با ابزارهای مترجم یار آشنا هستید اما تصمیم جدی جهت یادگیری استفاده از ابزارهای نوین و انتقال پروژه های ترجمه قدیمی به قدرتمندترین نرم افزار مدیریت پروژه های ترجمه را دارید، بنده پکیج آموزش فارسی نرم افزار SDL Trados Studio را پیشنهاد می کنم.

اگر از نرم افزارهای مترجم یار همانند Trados و MemoQ جهت مدیریت پروژه های ترجمه خود استفاده می کنید می توانید از محصولاتی مانند انواع بانک اطلاعات،پروژه های ترجمه آماده، حافظه ترجمه،واژه نامه خودپیشنهاددهنده و ترمبیس های عمومی و تخصصی که به صورت انحصاری توسط فروشگاه فایل های دیجیتال ارائه شده اند استفاده نمایید.

مطالعه بیشتر