تقریباً همه میدانند که یک رایانه کاراکترها را نمیفهمد، بلکه اعداد را درک میکند. بنابراین، هر کاراکتری که در برنامهای مانند Word روی صفحه میبینید، در داخل به عنوان یک عدد نگهداری میشود. "نقشهبرداری" کاراکترها به اعداد به عنوان یک نام شناخته میشود. مجموعه کاراکتر.
در بیشتر موارد، Word به مجموعه کاراکترهایی که هر نسخه از ویندوز استفاده میکنید متکی است. مجموعه کاراکترهای استفاده شده توسط ویندوز را با مجموعه کاراکترهای استفاده شده توسط خود رایانه اشتباه نگیرید، زیرا آنها یکسان نیستند. برای مثال، هنگامی که رایانه خود را برای اولین بار بوت می کنید، ممکن است برخی از اطلاعات راه اندازی را روی صفحه مشاهده کنید. اطلاعات از مجموعه کاراکترهایی استفاده می کند که به صورت داخلی توسط کامپیوتر روی ROM نگهداری می شود. از آنجایی که ویندوز در زمان نمایش این اطلاعات اجرا نمی شود، مجموعه کاراکترهای مورد استفاده ویندوز نمی تواند مورد استفاده قرار گیرد. هنگامی که ویندوز راه اندازی و اجرا می شود، مجموعه کاراکتر مورد استفاده توسط خود رایانه دیگر مورد استفاده قرار نمی گیرد و رایانه ای که توسط ویندوز نگهداری می شود متکی است.
این ممکن است گیج کننده به نظر برسد، اما قرار نیست اینطور باشد. در تاریخ نسبتاً کوتاه رایانه ها، چندین مجموعه کاراکترهای مختلف استفاده شده است. اولین مجموعه کاراکترهای مورد استفاده در کامپیوترهای کوچک ASCII بود که مخفف American Standard Code for Information Interchange است. به عنوان کدی از 128 کاراکتر شروع شد و از هفت بیت برای نشان دادن همه کاراکترها استفاده کرد. (بیت یک رقم باینری است؛ می تواند دو مقدار داشته باشد: روشن یا خاموش. بنابراین، هفت بیت می توانند 2^7 یا 128 مقدار منحصر به فرد ممکن داشته باشند.)
ASCII برای اولین بار برای ماشین هایی ساخته شد که تنها از هفت بیت از هر بایت استفاده می کردند (مانند تله تایپ). با این حال، رایانه های شخصی اولیه از هشت بیت استفاده می کردند و بنابراین می توانستند از 2^8 یا 256 مقدار ممکن برای یک کد کاراکتر استفاده کنند. این منجر به چیزی شد که به عنوان توسعه یافته ASCII شناخته می شد، جایی که 128 کاراکتر اول با نویسه های ASCII مطابقت داشت، اما 128 کاراکتر دوم به سازنده کامپیوتر واگذار شد. در مدلهای اولیه رایانههای شخصی IBM، مجموعه کاراکترهای ASCII توسعهیافته شامل برخی از نمادهای زبان خارجی و بسیاری از کاراکترهای خطکشی بود که برای گرافیکهای ابتدایی استفاده میشد.
مایکروسافت مجموعه کاراکترهای استفاده شده توسط رایانه شما را (همانطور که قبلاً در این نکته اشاره شد) مجموعه کاراکترهای OEM می نامد. (OEM به معنای «تولیدکننده تجهیزات اصلی» است.) نسخه های ویندوز از طریق ویندوز 95 از آنچه مجموعه کاراکترهای ANSI نامیده می شود استفاده می کنند. این یک مجموعه کاراکتر تک بایتی است که می تواند حداکثر 256 کاراکتر را نشان دهد. مجموعه اصلی کاراکترهای ASCII 128 کاراکتر اول مجموعه ANSI مورد استفاده در ویندوز را اشغال می کند. از طرف دیگر، تمام نسخه های بعدی ویندوز از مجموعه کاراکترهای یونیکد استفاده می کنند که در شماره های دیگر WordTips توضیح داده شده است .
به یاد داشته باشید که این بحث در مورد آنچه که نسخه های مختلف ویندوز استفاده می کنند به آنچه که آنها در داخل استفاده می کنند اشاره دارد. از نظر خارجی، برای یک کاربر معمولی Word، تأثیر زیادی وجود ندارد.