ممکن است قبلاً نام یونیکد را شنیده باشید و تعجب کرده باشید که معنای آن چیست. طرحهای کدگذاری معمولی تک بایتی (مانند ASCII و ANSI) اجازه میدهند تنها تا ۲۵۶ کاراکتر منحصربهفرد رمزگذاری شوند و در رایانه نمایش داده شوند. در جامعه جهانی کامپیوتر، که در آن هر عضو ملزم به کار به زبان خود است، این یک مشکل است. بیش از 256 کاراکتر رایج در سراسر جهان وجود دارد.
اینجاست که یونیکد وارد عمل می شود.
بسته به نسخه یونیکد مورد استفاده، استاندارد برای رمزگذاری هر کاراکتر به دو تا پنج بایت نیاز دارد. از زمان نوشتن این مقاله، استاندارد فعلی یونیکد 9.0.0 است که از پنج بایت و 128172 کاراکتر تعریف شده استفاده می کند. این استاندارد که توسط کنسرسیوم یونیکد (http://www.unicode.org) ابداع و ترویج شده است، امکان نمایش تقریباً تمام کاراکترهای زبان منحصر به فرد در جهان را فراهم می کند. تیمی از متخصصان کامپیوتر، زبان شناسان و محققان به کار بر روی توسعه واقعی یونیکد ادامه می دهند.
استفاده از چندین بایت برای تعریف هر کاراکتر به این معنی است که یونیکد را می توان برای رمزگذاری بیشتر کاراکترهای مورد استفاده در زبان های اصلی دنیا استفاده کرد. همچنین مکانیزم فرمت نیز در استاندارد تعبیه شده است که به این معنی است که امکان رمزگذاری وجود دارد. در صورت لزوم، نزدیک به یک میلیون نویسه دیگر. این توانایی باید برای همه الزامات زبان شناخته شده، به علاوه رمزگذاری تمام خطهای تاریخی جهان کافی باشد. (این شامل زبانها و نمادهایی است که دیگر استفاده نمیشوند.)
همانطور که در حال حاضر تعریف شده است، یونیکد 9.0.0 (آخرین نسخه منتشر شده در ژوئن 2016) شامل کدهایی برای کاراکترهای مورد استفاده در زبان های نوشتاری اصلی جهان، از جمله عربی، ارمنی، بالی، بنگالی، بوپوموفو، بوهید، هجای کانادایی، چروکی، چینی، سیریلیک، صحرا، دوانگاری، اتیوپی، گرجی، گوتیک، یونانی، گجراتی، گورموکی، هان، هانگول، هانون—o، عبری، هیراگانا، کانادا، کاتاکانا، خمر، لائوس، لاتین، مالایالام، مغولی، میانمار، اوگام، ایتالیایی قدیم (اتروسکی)، اوریا، فنیقی، رونی، سینهالی، سریانی، تاگالوگ، تاگبانوا، تامیل، تلوگو، تاانا، تایلندی، تبتی، و یی. کار برای افزودن کاراکترهای بیشتر از زبان های کمتر شناخته شده در حال پیشرفت است.
علاوه بر این، یونیکد شامل بسیاری از نمادهای مختلف، از جمله اعداد، نشانههای کلی، علائم نگارشی عمومی، نمادهای عمومی، dingbats، شکلکها، فلشها، بلوکها، فرمهای طراحی جعبه، اشکال هندسی، نمادهای ریاضی، نمادهای موسیقی (غربی و بیزانسی)، نمادهای فنی است. ، الگوهای بریل و رادیکال های Kangxi.
یونیکد در تمامی نسخه های مدرن ویندوز و ورد پشتیبانی می شود. اینکه دقیقا چه استانداردی از یونیکد پشتیبانی می شود به نسخه ویندوز و ورد مورد نظر بستگی دارد.