%{ ///////////////////////////////////////////////////////////////////////// // $Id: lexer.l,v 1.31 2009-10-15 20:50:33 sshwarts Exp $ ///////////////////////////////////////////////////////////////////////// #include #include #ifdef WIN32 #include #define YY_NO_UNISTD_H #endif #include "debug.h" #if BX_DEBUGGER #include "parser.h" int bx_yyinput(char *buf, int max_size); #undef YY_INPUT #define YY_INPUT(buf, ret, max_size) (ret = bx_yyinput(buf, max_size)) static char *lex_input_ptr = NULL; static unsigned lex_input_size = 0; #if BX_SUPPORT_X86_64 #define LONG_MODE_8BL_REG(reg) \ { bxlval.uval = reg; return(BX_TOKEN_8BL_REG); } #define LONG_MODE_16B_REG(reg) \ { bxlval.uval = reg; return(BX_TOKEN_16B_REG); } #define LONG_MODE_32B_REG(reg) \ { bxlval.uval = reg; return(BX_TOKEN_32B_REG); } #define LONG_MODE_64B_REG(reg) \ { bxlval.uval = reg; return(BX_TOKEN_64B_REG); } #else #define LONG_MODE_8BL_REG(reg) \ { bxlval.sval = strdup(bxtext); return(BX_TOKEN_GENERIC); } #define LONG_MODE_16B_REG(reg) \ { bxlval.sval = strdup(bxtext); return(BX_TOKEN_GENERIC); } #define LONG_MODE_32B_REG(reg) \ { bxlval.sval = strdup(bxtext); return(BX_TOKEN_GENERIC); } #define LONG_MODE_64B_REG(reg) \ { bxlval.sval = strdup(bxtext); return(BX_TOKEN_GENERIC); } #endif %} %x EXAMINE %x DISASM %% <*>[ \t]+ ; // eat up whitespace set { bxlval.sval = strdup(bxtext); return(BX_TOKEN_SET); } on { bxlval.bval = 1; return(BX_TOKEN_ON); } off { bxlval.bval = 0; return(BX_TOKEN_OFF); } crc { bxlval.sval = strdup(bxtext); return(BX_TOKEN_CRC); } c | cont | continue { bxlval.sval = strdup(bxtext); return(BX_TOKEN_CONTINUE); } stepi | step | s { bxlval.sval = strdup(bxtext); return(BX_TOKEN_STEPN); } next | n | p { bxlval.sval = strdup(bxtext); return(BX_TOKEN_STEP_OVER); } blist { bxlval.sval = strdup(bxtext); return(BX_TOKEN_LIST_BREAK); } vb|vbreak { bxlval.sval = strdup(bxtext); return(BX_TOKEN_VBREAKPOINT); } lb|lbreak { bxlval.sval = strdup(bxtext); return(BX_TOKEN_LBREAKPOINT); } break | b|pb | pbreak { bxlval.sval = strdup(bxtext); return(BX_TOKEN_PBREAKPOINT); } info { bxlval.sval = strdup(bxtext); return(BX_TOKEN_INFO); } cr | creg { bxlval.sval = strdup(bxtext); return(BX_TOKEN_CONTROL_REGS); } dr | dreg { bxlval.sval = strdup(bxtext); return(BX_TOKEN_DEBUG_REGS); } sreg { bxlval.sval = strdup(bxtext); return(BX_TOKEN_SEGMENT_REGS); } r { bxlval.sval = strdup(bxtext); return(BX_TOKEN_R); } reg|regs | registers { bxlval.sval = strdup(bxtext); return(BX_TOKEN_REGS); } fp|fpu { bxlval.sval = strdup(bxtext); return(BX_TOKEN_FPU); } sse | xmm { bxlval.sval = strdup(bxtext); return(BX_TOKEN_SSE); } mmx { bxlval.sval = strdup(bxtext); return(BX_TOKEN_MMX); } cpu { bxlval.sval = strdup(bxtext); return(BX_TOKEN_CPU); } idt { bxlval.sval = strdup(bxtext); return(BX_TOKEN_IDT); } ivt { bxlval.sval = strdup(bxtext); return(BX_TOKEN_IVT); } gdt { bxlval.sval = strdup(bxtext); return(BX_TOKEN_GDT); } ldt { bxlval.sval = strdup(bxtext); return(BX_TOKEN_LDT); } tss { bxlval.sval = strdup(bxtext); return(BX_TOKEN_TSS); } tab { bxlval.sval = strdup(bxtext); return(BX_TOKEN_TAB); } linux { bxlval.sval = strdup(bxtext); return(BX_TOKEN_LINUX); } delete | del | d { bxlval.sval = strdup(bxtext); return(BX_TOKEN_DEL_BREAKPOINT); } bpe { bxlval.sval = strdup(bxtext); return(BX_TOKEN_ENABLE_BREAKPOINT); } bpd { bxlval.sval = strdup(bxtext); return(BX_TOKEN_DISABLE_BREAKPOINT); } quit | exit | q { bxlval.sval = strdup(bxtext); return(BX_TOKEN_QUIT); } x | xp { BEGIN(EXAMINE); bxlval.sval = strdup(bxtext); return(BX_TOKEN_EXAMINE); } restore { bxlval.sval = strdup(bxtext); return(BX_TOKEN_RESTORE); } setpmem { bxlval.sval = strdup(bxtext); return(BX_TOKEN_SETPMEM); } query { bxlval.sval = strdup(bxtext); return(BX_TOKEN_QUERY); } pending { bxlval.sval = strdup(bxtext); return(BX_TOKEN_PENDING); } take { bxlval.sval = strdup(bxtext); return(BX_TOKEN_TAKE); } dma { bxlval.sval = strdup(bxtext); return(BX_TOKEN_DMA); } irq { bxlval.sval = strdup(bxtext); return(BX_TOKEN_IRQ); } pic { bxlval.sval = strdup(bxtext); return(BX_TOKEN_PIC); } u | disasm | disassemble { BEGIN(DISASM); bxlval.sval = strdup(bxtext); return(BX_TOKEN_DISASSEMBLE); } instrument { bxlval.sval = strdup(bxtext); return(BX_TOKEN_INSTRUMENT); } stop { bxlval.sval = strdup(bxtext); return(BX_TOKEN_STOP); } doit { bxlval.sval = strdup(bxtext); return(BX_TOKEN_DOIT); } trace { bxlval.sval = strdup(bxtext); return(BX_TOKEN_TRACE); } trace-reg { bxlval.sval = strdup(bxtext); return(BX_TOKEN_TRACEREG); } trace-mem { bxlval.sval = strdup(bxtext); return(BX_TOKEN_TRACEMEM); } switch-mode { bxlval.sval = strdup(bxtext); return(BX_TOKEN_SWITCH_MODE); } size { bxlval.sval = strdup(bxtext); return(BX_TOKEN_SIZE); } ptime { bxlval.sval = strdup(bxtext); return(BX_TOKEN_PTIME); } sb { bxlval.sval = strdup(bxtext); return(BX_TOKEN_TIMEBP); } sba { bxlval.sval = strdup(bxtext); return(BX_TOKEN_TIMEBP_ABSOLUTE); } record { bxlval.sval = strdup(bxtext); return(BX_TOKEN_RECORD); } playback { bxlval.sval = strdup(bxtext); return(BX_TOKEN_PLAYBACK); } modebp { bxlval.sval = strdup(bxtext); return(BX_TOKEN_MODEBP); } print-stack { bxlval.sval = strdup(bxtext); return(BX_TOKEN_PRINT_STACK); } watch { bxlval.sval = strdup(bxtext); return(BX_TOKEN_WATCH); } unwatch { bxlval.sval = strdup(bxtext); return(BX_TOKEN_UNWATCH); } read { bxlval.sval = strdup(bxtext); return(BX_TOKEN_READ); } w|write { bxlval.sval = strdup(bxtext); return(BX_TOKEN_WRITE); } show { bxlval.sval = strdup(bxtext); return(BX_TOKEN_SHOW); } ldsym { bxlval.sval = strdup(bxtext); return(BX_TOKEN_LOAD_SYMBOLS); } symbols { bxlval.sval = strdup(bxtext); return(BX_TOKEN_SYMBOLS); } slist { bxlval.sval = strdup(bxtext); return(BX_TOKEN_LIST_SYMBOLS); } global { bxlval.sval = strdup(bxtext); return(BX_TOKEN_GLOBAL); } where { bxlval.sval = strdup(bxtext); return(BX_TOKEN_WHERE); } print-string { bxlval.sval = strdup(bxtext); return(BX_TOKEN_PRINT_STRING); } ne2k|ne2000 { bxlval.sval = strdup(bxtext); return(BX_TOKEN_NE2000); } page { bxlval.sval = strdup(bxtext); return(BX_TOKEN_PAGE); } vga { bxlval.sval = strdup(bxtext); return(BX_TOKEN_VGA); } pci { bxlval.sval = strdup(bxtext); return(BX_TOKEN_PCI); } al { bxlval.uval = BX_DBG_REG8L_AL; return(BX_TOKEN_8BL_REG);} bl { bxlval.uval = BX_DBG_REG8L_BL; return(BX_TOKEN_8BL_REG);} cl { bxlval.uval = BX_DBG_REG8L_CL; return(BX_TOKEN_8BL_REG);} dl { bxlval.uval = BX_DBG_REG8L_DL; return(BX_TOKEN_8BL_REG);} sil { LONG_MODE_8BL_REG(BX_DBG_REG8L_SIL); } dil { LONG_MODE_8BL_REG(BX_DBG_REG8L_DIL); } spl { LONG_MODE_8BL_REG(BX_DBG_REG8L_SPL); } bpl { LONG_MODE_8BL_REG(BX_DBG_REG8L_BPL); } r8b { LONG_MODE_8BL_REG(BX_DBG_REG8L_R8); } r9b { LONG_MODE_8BL_REG(BX_DBG_REG8L_R9); } r10b { LONG_MODE_8BL_REG(BX_DBG_REG8L_R10); } r11b { LONG_MODE_8BL_REG(BX_DBG_REG8L_R11); } r12b { LONG_MODE_8BL_REG(BX_DBG_REG8L_R12); } r13b { LONG_MODE_8BL_REG(BX_DBG_REG8L_R13); } r14b { LONG_MODE_8BL_REG(BX_DBG_REG8L_R14); } r15b { LONG_MODE_8BL_REG(BX_DBG_REG8L_R15); } ah { bxlval.uval = BX_DBG_REG8H_AH; return(BX_TOKEN_8BH_REG);} bh { bxlval.uval = BX_DBG_REG8H_BH; return(BX_TOKEN_8BH_REG);} ch { bxlval.uval = BX_DBG_REG8H_CH; return(BX_TOKEN_8BH_REG);} dh { bxlval.uval = BX_DBG_REG8H_DH; return(BX_TOKEN_8BH_REG);} ax { bxlval.uval = BX_DBG_REG16_AX; return(BX_TOKEN_16B_REG);} bx { bxlval.uval = BX_DBG_REG16_BX; return(BX_TOKEN_16B_REG);} cx { bxlval.uval = BX_DBG_REG16_CX; return(BX_TOKEN_16B_REG);} dx { bxlval.uval = BX_DBG_REG16_DX; return(BX_TOKEN_16B_REG);} si { bxlval.uval = BX_DBG_REG16_SI; return(BX_TOKEN_16B_REG);} di { bxlval.uval = BX_DBG_REG16_DI; return(BX_TOKEN_16B_REG);} bp { bxlval.uval = BX_DBG_REG16_BP; return(BX_TOKEN_16B_REG);} sp { bxlval.uval = BX_DBG_REG16_SP; return(BX_TOKEN_16B_REG);} r8w { LONG_MODE_16B_REG(BX_DBG_REG16_R8); } r9w { LONG_MODE_16B_REG(BX_DBG_REG16_R9); } r10w { LONG_MODE_16B_REG(BX_DBG_REG16_R10); } r11w { LONG_MODE_16B_REG(BX_DBG_REG16_R11); } r12w { LONG_MODE_16B_REG(BX_DBG_REG16_R12); } r13w { LONG_MODE_16B_REG(BX_DBG_REG16_R13); } r14w { LONG_MODE_16B_REG(BX_DBG_REG16_R14); } r15w { LONG_MODE_16B_REG(BX_DBG_REG16_R15); } eax { bxlval.uval = BX_DBG_REG32_EAX; return(BX_TOKEN_32B_REG);} ebx { bxlval.uval = BX_DBG_REG32_EBX; return(BX_TOKEN_32B_REG);} ecx { bxlval.uval = BX_DBG_REG32_ECX; return(BX_TOKEN_32B_REG);} edx { bxlval.uval = BX_DBG_REG32_EDX; return(BX_TOKEN_32B_REG);} esi { bxlval.uval = BX_DBG_REG32_ESI; return(BX_TOKEN_32B_REG);} edi { bxlval.uval = BX_DBG_REG32_EDI; return(BX_TOKEN_32B_REG);} ebp { bxlval.uval = BX_DBG_REG32_EBP; return(BX_TOKEN_32B_REG);} esp { bxlval.uval = BX_DBG_REG32_ESP; return(BX_TOKEN_32B_REG);} r8d { LONG_MODE_32B_REG(BX_DBG_REG32_R8); } r9d { LONG_MODE_32B_REG(BX_DBG_REG32_R9); } r10d { LONG_MODE_32B_REG(BX_DBG_REG32_R10); } r11d { LONG_MODE_32B_REG(BX_DBG_REG32_R11); } r12d { LONG_MODE_32B_REG(BX_DBG_REG32_R12); } r13d { LONG_MODE_32B_REG(BX_DBG_REG32_R13); } r14d { LONG_MODE_32B_REG(BX_DBG_REG32_R14); } r15d { LONG_MODE_32B_REG(BX_DBG_REG32_R15); } rax { LONG_MODE_64B_REG(BX_DBG_REG64_RAX); } rbx { LONG_MODE_64B_REG(BX_DBG_REG64_RBX); } rcx { LONG_MODE_64B_REG(BX_DBG_REG64_RCX); } rdx { LONG_MODE_64B_REG(BX_DBG_REG64_RDX); } rsi { LONG_MODE_64B_REG(BX_DBG_REG64_RSI); } rdi { LONG_MODE_64B_REG(BX_DBG_REG64_RDI); } rsp { LONG_MODE_64B_REG(BX_DBG_REG64_RSP); } rbp { LONG_MODE_64B_REG(BX_DBG_REG64_RBP); } r8 { LONG_MODE_64B_REG(BX_DBG_REG64_R8); } r9 { LONG_MODE_64B_REG(BX_DBG_REG64_R9); } r10 { LONG_MODE_64B_REG(BX_DBG_REG64_R10); } r11 { LONG_MODE_64B_REG(BX_DBG_REG64_R11); } r12 { LONG_MODE_64B_REG(BX_DBG_REG64_R12); } r13 { LONG_MODE_64B_REG(BX_DBG_REG64_R13); } r14 { LONG_MODE_64B_REG(BX_DBG_REG64_R14); } r15 { LONG_MODE_64B_REG(BX_DBG_REG64_R15); } ip { return(BX_TOKEN_REG_IP); } eip { return(BX_TOKEN_REG_EIP);} rip { return(BX_TOKEN_REG_RIP);} cs { bxlval.uval = BX_DBG_SREG_CS; return(BX_TOKEN_CS); } es { bxlval.uval = BX_DBG_SREG_ES; return(BX_TOKEN_ES); } ss { bxlval.uval = BX_DBG_SREG_SS; return(BX_TOKEN_SS); } ds { bxlval.uval = BX_DBG_SREG_DS; return(BX_TOKEN_DS); } fs { bxlval.uval = BX_DBG_SREG_FS; return(BX_TOKEN_FS); } gs { bxlval.uval = BX_DBG_SREG_GS; return(BX_TOKEN_GS); } flags|eflags { bxlval.uval = 0; return (BX_TOKEN_FLAGS); } h|help { bxlval.sval = strdup(bxtext); return(BX_TOKEN_HELP); } \? | calc { bxlval.sval = strdup(bxtext); return(BX_TOKEN_CALC); } \/[0-9]+ { BEGIN(INITIAL); bxlval.sval = strdup(bxtext); return(BX_TOKEN_XFORMAT); } \/[0-9]*[mxduotcsibhwg]+ { BEGIN(INITIAL); bxlval.sval = strdup(bxtext); return(BX_TOKEN_XFORMAT); } \/[0-9]+ { BEGIN(INITIAL); bxlval.sval = strdup(bxtext); return(BX_TOKEN_DISFORMAT); } "+" { return ('+'); } "-" { return ('-'); } "*" { return ('*'); } "/" { return ('/'); } ">>" { return (BX_TOKEN_RSHIFT); } "<<" { return (BX_TOKEN_LSHIFT); } "&" { return ('&'); } "|" { return ('|'); } "^" { return ('^'); } "!" { return ('!'); } "(" { return ('('); } ")" { return (')'); } \'([^\\\'\n]|(\\.))*\' | /* throw away leading and trailing \" */ \"([^\\\"\n]|(\\.))*\" { bxlval.sval = strdup(bxtext+1); bxlval.sval[strlen(bxlval.sval)-1] = 0; return(BX_TOKEN_STRING); } 0x[0-9a-fA-F]+ { bxlval.uval = strtoull(bxtext, NULL, 16); return(BX_TOKEN_NUMERIC); } 0[0-7]+ { bxlval.uval = strtoull(bxtext, NULL, 8); return(BX_TOKEN_NUMERIC); } [0-9]+ { bxlval.uval = strtoull(bxtext, NULL, 10); return(BX_TOKEN_NUMERIC); } [a-z-]+ { bxlval.sval = strdup(bxtext); return(BX_TOKEN_COMMAND); } $[a-zA-Z_][a-zA-Z0-9_]* { bxlval.sval = strdup(bxtext); return(BX_TOKEN_SYMBOLNAME); } [A-Za-z_][A-Za-z0-9_]* { bxlval.sval = strdup(bxtext); return(BX_TOKEN_GENERIC); } <*>";" { return ('\n'); } <*>\n { return ('\n'); } [#][^\n]* ; // eat up comments '//' . { return(bxtext[0]); } . { BEGIN(INITIAL); unput(*bxtext); } %% int bx_yyinput(char *buf, int max_size) { int len; if (lex_input_size == 0) { fprintf(stderr, "lex: no characters in string input buffer.\n"); exit(1); } len = strlen(lex_input_ptr) + 1; if (len > max_size) len = max_size; memcpy(buf, lex_input_ptr, len); return(len); } void bx_add_lex_input(char *buf) { lex_input_ptr = buf; lex_input_size = strlen(buf); // Since we're parsing from strings, flush out // all current buffer state, so the next read // requests from yyinput bx_flush_buffer( YY_CURRENT_BUFFER ); } #endif /* if BX_DEBUGGER */