FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4192, 693 aa 1>>>pF1KE4192 693 - 693 aa - 693 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.4339+/-0.00112; mu= 13.3048+/- 0.067 mean_var=65.6751+/-13.441, 0's: 0 Z-trim(101.0): 29 B-trim: 0 in 0/49 Lambda= 0.158261 statistics sampled from 6342 (6356) to 6342 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.54), E-opt: 0.2 (0.195), width: 16 Scan time: 3.360 The best scores are: opt bits E(32554) CCDS34355.1 ZBED9 gene_id:114821|Hs108|chr6 (1325) 1457 342.1 3.2e-93 CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1 (1325) 1257 296.4 1.8e-79 CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5 ( 594) 1203 284.1 4e-76 CCDS47028.1 FAM200B gene_id:285550|Hs108|chr4 ( 657) 952 226.8 8e-59 CCDS5668.1 FAM200A gene_id:221786|Hs108|chr7 ( 573) 872 208.5 2.2e-53 CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 ( 949) 549 134.8 5.8e-31 CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 ( 949) 545 133.8 1.1e-30 CCDS46790.1 EPM2AIP1 gene_id:9852|Hs108|chr3 ( 607) 434 108.5 3e-23 >>CCDS34355.1 ZBED9 gene_id:114821|Hs108|chr6 (1325 aa) initn: 1231 init1: 468 opt: 1457 Z-score: 1787.1 bits: 342.1 E(32554): 3.2e-93 Smith-Waterman score: 1457; 37.5% identity (69.6% similar) in 645 aa overlap (64-693:683-1325) 40 50 60 70 80 90 pF1KE4 LPMDLLLKQGSLKQEVESFCYQIVSESNDQKVGILQSEDKQLQPSVSKK---SEGELSRV ::: .... .:. :.:. :: : CCDS34 MKRKHDEIQRSLPVKPSKMLKPSGTPFSPDKVGDWMAKQASLDFFVKKRHAFSEHSSSNK 660 670 680 690 700 710 100 110 120 130 140 pF1KE4 KFISNSNKITFSKKPK-----RRKYDESYLSFGFTYFGNRDAPHAQCVLCKKILSNSSLA . ..: . .: . :::: ::. :::. . .. . ::..: .:.: .. CCDS34 RNVNNRSYPEEGKTKRVHASFTRKYDPSYIEFGFVAVIDGEVLKPQCIICGDVLANEAMK 720 730 740 750 760 770 150 160 170 180 190 200 pF1KE4 PSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKIVNTDNESATEASYNVSYHIA ::::.::: .:: ... ::... .: ...: :. : :: .:::.:. .: CCDS34 PSKLKRHLYSKHKEISSQPKEFFERK-SSELKSQPKQVFNVSHINISALRASYKVALPVA 780 790 800 810 820 830 210 220 230 240 250 260 pF1KE4 LSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVC : .::.: :.: : :.: ..:. :. .::. : :::.:.::::..:: :.:..:. CCDS34 KSKTPYTIAETLVKDCIKEVCLEMLGESAAKKVAQVPLSNDTIARRIQELANDMEDQLIE 840 850 860 870 880 890 270 280 290 300 310 320 pF1KE4 RLKICDGFSLQLDESADVSGLAVLLVFVRYRFNKSIEEDLLLCESLQSNATGEEIFNCIN ..:. ::::::: :.... .:::.::.. . .:.:.... :: .:.:. :... .. CCDS34 QIKLAKYFSLQLDECRDIANMIILLVYVRFEHDDDIKEEFFFSASLPTNTTSSELYEAVK 900 910 920 930 940 950 330 340 350 360 370 380 pF1KE4 SFM-QKHEIEWEKCVDVCSDASRAVDGKIAEAVTLIKYVAPESTSSHCLLYRHALAVKIM ... .: .:.. :: ::::.. .. :: .:.:: :: .::: ..::...:..::.: . CCDS34 NYIVNKCGLEFKFCVGVCSDGAASMTGKHSEVVTQIKELAPECKTTHCFIHRESLAMKKI 960 970 980 990 1000 1010 390 400 410 420 430 440 pF1KE4 PTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRL . :..::.. :.:.::::. .:::...::..: :.: :::..:.::::::::: :. CCDS34 SAELNSVLNDIVKIVNYIKSNSLNSRLFSLLCDNMEADHKQLLLHAEIRWLSRGKVLSRM 1020 1030 1040 1050 1060 1070 450 460 470 480 490 500 pF1KE4 FELRRELLVFMDSAFRL-SDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFD ::.: :::::... . :. . . .: :::::.:::. .:..: ::::::.: :.. : CCDS34 FEIRNELLVFLQGKKPMWSQLFKDVNWTARLAYLSDIFSIFNDLNASMQGKNATYFSMAD 1080 1090 1100 1110 1120 1130 510 520 530 540 550 560 pF1KE4 KMSSLLRKLEFWASSVEEENFDCFPTLSDFLTEINSTVD-KDICSAIVQHLRGLRATLLK :. . .::: : . . . .: : .:. ...:... .: . ..: .:: .: . CCDS34 KVEGQKQKLEAWKNRISTDCYDMFHNLTTIINEVGNDLDIAHLRKVISEHLTNLLECFEF 1140 1150 1160 1170 1180 1190 570 580 590 600 610 pF1KE4 YFPVTND---NNAWVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSEL-SLNDFWS ::: .: .: :..::: . .:.. ..:. :..: .: .: . :: .:: CCDS34 YFPSKEDPRIGNLWIQNPFLSSKDNLNLTVTLQDKLLKLATDEGLKISFENTASLPSFWI 1200 1210 1220 1230 1240 1250 620 630 640 650 660 670 pF1KE4 SLIQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPN . ..:: .:. :...:: : . .::::::: .. :::.:. :. .:. ::.: : CCDS34 KAKNDYPELAEIALKLLLLFPSTYLCETGFSTLSVIKTKHRNSLNIHYPLRVALSSIQPR 1260 1270 1280 1290 1300 1310 680 690 pF1KE4 IKRICDKKTQKHCSH . .. .:: : : :: CCDS34 LDKLTSKK-QAHLSH 1320 >>CCDS387.2 ZMYM6 gene_id:9204|Hs108|chr1 (1325 aa) initn: 1092 init1: 291 opt: 1257 Z-score: 1540.3 bits: 296.4 E(32554): 1.8e-79 Smith-Waterman score: 1260; 32.2% identity (70.6% similar) in 636 aa overlap (67-686:696-1324) 40 50 60 70 80 90 pF1KE4 DLLLKQGSLKQEVESFCYQIVSESNDQKVGILQSEDKQLQPSVSKKSEGELSRVKFISNS . :.. . .: ...: : . . . . ... CCDS38 STQEDAMKFPSSQSSQPSRLLKNKGISCKPVTQTKATSCKPHTQHK-ECQ-TDLPMPNEK 670 680 690 700 710 720 100 110 120 130 140 pF1KE4 NKITFSKKPKRRK-------YDESYLSFGFTYF-GNRDA-PHAQCVLCKKILSNSSLAPS : ... :...: :: ::. :: :.... :. :::.: .:::. .. :. CCDS38 NDAELDSPPSKKKRLGFFQTYDTEYLKVGFIICPGSKESSPRPQCVICGEILSSENMKPA 730 740 750 760 770 780 150 160 170 180 190 200 pF1KE4 KLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKIVNTDNESATEASYNVSYHIALS .: .::.:::. ..: ..::.:. : .. : . .. .: ..::: .... : : CCDS38 NLSHHLKTKHSELENKPVDFFEQKSLEMECQNSSLKKCLLVE-KSLVKASYLIAFQTAAS 790 800 810 820 830 840 210 220 230 240 250 260 pF1KE4 GEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRL . .:.: :::: .. ... . . :. .. ::: :. .:: .:.::::..:. .. CCDS38 KKPFSIAEELIKPYLVEMCSEVLGSSAGDKMKTIPLSNVTIQHRIDELSADIEDQLIQKV 850 860 870 880 890 900 270 280 290 300 310 320 pF1KE4 KICDGFSLQLDESADVSGLAVLLVFVRY-RFN-KSIEEDLLLCESLQSNATGEEIFNCIN . :.::.:::...:....:: ..:. .. ....:.::.: . .. :: :::. :: CCDS38 RESKWFALQIDESSEISNITLLLCYIRFIDYDCRDVKEELLFCIEMPTQITGFEIFELIN 910 920 930 940 950 960 330 340 350 360 370 380 pF1KE4 SFMQKHEIEWEKCVDVCSDASRAVDGKIAEAVTLIKYVAPESTS-SHCLLYRHALAVKIM ...... ..:..:: .:.:.. .. :. . . :. :: .... .::...:. :... . CCDS38 KYIDSKSLNWKHCVGLCTDGAASMTGRYSGLKAKIQEVAMNTAAFTHCFIHRERLVAEKL 970 980 990 1000 1010 1020 390 400 410 420 430 440 pF1KE4 PTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRL :...: :..::...::. .::.: :::::::..:..: :..::::.:::..: :: CCDS38 SPCLHKILLQSAQILSFIKSNALNSRMLTILCEEMGSEHVSLPLHAEVRWISRGRMLKRL 1030 1040 1050 1060 1070 1080 450 460 470 480 490 500 pF1KE4 FELRRELLVFMDSAFR-LSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFD ::::.:. .:... :. . . :. .::::.:::. .::.:::.:: .: :.. . CCDS38 FELRHEIEIFLSQKHSDLAKYFHDEEWVGKLAYLSDIFSLINELNLSLQGTLTTFFNLCN 1090 1100 1110 1120 1130 1140 510 520 530 540 550 560 pF1KE4 KMSSLLRKLEFWASSVEEENFDCFPTLSDFLTEINSTVDKDICSAIVQHLRGLRATLLKY :.. . :::..: . ..:...: ::..:.: .. .. :: : .::.:: .. CCDS38 KIDVFKRKLKMWLKRTQENDYDMFPSFSEF-SNSSGLNMTDITRIIFEHLEGLSQVFSDC 1150 1160 1170 1180 1190 1200 570 580 590 600 610 620 pF1KE4 FPVTND---NNAWVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSL :: .: .: :. .:: .. . .:. . :.: .:.:: .. :. .:...:: . CCDS38 FPPEQDLRSGNLWIIHPF-MNHQNNNLTDFEEEKLTELSSDLGLQALFKSVSVTQFWINA 1210 1220 1230 1240 1250 1260 630 640 650 660 670 680 pF1KE4 IQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIK :: . .::.. ::::.:..::...:: : :..: .. : ..: .:. .... : :. CCDS38 KTSYPELHERAMKFLLPFSTVYLCDAAFS--ALTESKQKNLLGSGPALRLAVTSLIPRIE 1270 1280 1290 1300 1310 690 pF1KE4 RICDKKTQKHCSH .. .: CCDS38 KLVKEKE 1320 >>CCDS34283.1 ZBED8 gene_id:63920|Hs108|chr5 (594 aa) initn: 1075 init1: 473 opt: 1203 Z-score: 1480.1 bits: 284.1 E(32554): 4e-76 Smith-Waterman score: 1203; 32.9% identity (68.9% similar) in 592 aa overlap (106-688:3-588) 80 90 100 110 120 130 pF1KE4 QPSVSKKSEGELSRVKFISNSNKITFSKKPKRRKYDESYLSFGFTYFGNRDAPH-AQCVL :.::.:..:. . :: . :. . :::: CCDS34 MSKKRKWDDDYVRYWFTCTTEVDGTQRPQCVL 10 20 30 140 150 160 170 180 190 pF1KE4 CKKILSNSSLAPSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKI-VNTDNESA :....::..: :::: :.. .:.. .:.. .: :. .: ... . : . ... CCDS34 CNSVFSNADLRPSKLSDHFNRQHGGVAGHDLNSLK-HMPAPSDQSETLKAFGVASHEDTL 40 50 60 70 80 90 200 210 220 230 240 250 pF1KE4 TEASYNVSYHIALSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIK .:::. .: : . ::..: :.:::: .... .. . .::.. : ::.... :: CCDS34 LQASYQFAYLCAKEKNPHTVAEKLVKPCALEIAQIVLGPDAQKKLQQVPLSDDVIHSRID 100 110 120 130 140 150 260 270 280 290 300 310 pF1KE4 DLAADIEEELVCRLKICD-GFSLQLDESADVSGLAVLLVFVRYRFNKSIEEDLLLCESLQ ... :: .... .: ..:: :..:.. . :..:::: .. : :..:.:: :: CCDS34 EMSQDILQQVLEDIKASPLKVGIQLAETTDMDDCSQLMAFVRYIKEREIVEEFLFCEPLQ 160 170 180 190 200 210 320 330 340 350 360 370 pF1KE4 SNATGEEIFNCINSFMQKHEIEWEKCVDVCSDASRAVDGKIAEAVTLIKYVAPESTSSHC . : ..:: . .:. ::.: . : .::.:.. .. :. .: :. .: :. . .:: CCDS34 LSMKGIDVFNLFRDFFLKHKIALDVCGSVCTDGASSMLGENSEFVAYVKKEIPHIVVTHC 220 230 240 250 260 270 380 390 400 410 420 430 pF1KE4 LLYRHALAVKIMPTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEV :: :::..: .::.:...: .:..::.::.: . ::.. . ::.: ....::..::. CCDS34 LLNPHALVIKTLPTKLRDALFTVVRVINFIKGRAPNHRLFQAFFEEIGIEYSVLLFHTEM 280 290 300 310 320 330 440 450 460 470 480 490 pF1KE4 RWLSRGKVLVRLFELRRELLVFMD-SAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSM ::::::..:...::. .:. :. .. : : . :. . ..::::::.: .:::.. :: CCDS34 RWLSRGQILTHIFEMYEEINQFLHHKSSNLVDGFENKEFKIHLAYLADLFKHLNELSASM 340 350 360 370 380 390 500 510 520 530 540 550 pF1KE4 QGKNVTVFTVFDKMSSLLRKLEFWASSVEEENFDCFPTLSDFLTEINSTVDKDICSAIVQ : .... .. .:.:...::. :: . .:..:: :: : .... : . : . :. CCDS34 QRTGMNTVSAREKLSAFVRKFPFWQKRIEKRNFTNFPFLEEIIVSDNEGIF--IAAEITL 400 410 420 430 440 560 570 580 590 600 pF1KE4 HLRGLRATLLKYFPVTNDNNA--WVRNPFTVTVKPASLVARDY---ESLIDLTSDSQVKQ ::. : . :: . . :.: :. .:: .. ..: .: ..: .: ...:. . CCDS34 HLQQLSNFFHGYFSIGDLNEASKWILDPFLFNI---DFVDDSYLMKNDLAELRASGQILM 450 460 470 480 490 500 610 620 630 640 650 660 pF1KE4 NFSELSLNDFWSSLIQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAP .: ..:.::: . . .:..:. :...:.:::: .::: ::: ::: :. .. . CCDS34 EFETMKLEDFWCAQFTAFPNLAKTALEILMPFATTYLCELGFSSLLHFKTKSRSCFNLSD 510 520 530 540 550 560 670 680 690 pF1KE4 HMRIRLSNITPNIKRICDKKTQKHCSH .:. .:. .: .. : ..: : CCDS34 DIRVAISKKVPRFSDIIEQKLQLQQKSL 570 580 590 >>CCDS47028.1 FAM200B gene_id:285550|Hs108|chr4 (657 aa) initn: 747 init1: 286 opt: 952 Z-score: 1169.5 bits: 226.8 E(32554): 8e-59 Smith-Waterman score: 1204; 32.9% identity (67.4% similar) in 675 aa overlap (36-688:1-655) 10 20 30 40 50 60 pF1KE4 LCILSYNFNTFAILNVYSKLTMFCTTNSLPMDLLLKQGSLKQEVESFCYQIVSESNDQKV :: .. . . ..::. : . :.. . CCDS47 MDHFFIKRKRNSEVK---YTEACSSSSVES 10 20 70 80 90 100 110 120 pF1KE4 GILQSEDKQLQPSVSKKSEGELSRVKFISNSNKITFSKKP-KRRKYDESYLSFGFTY--- ::..:.. . :.....:. :.: . :.:: . :.:.:.::..:: CCDS47 GIVNSDN------IEKNTDSNLQT----STSFEPHFKKKKVSARRYNEDYLKYGFIKCEK 30 40 50 60 70 130 140 150 160 170 180 pF1KE4 -FGNRDAPHAQCVLCKKILSNSSLAPSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKP : : : : :::.:..::.: :: ::::.:::::.:: :: . .:... .. : CCDS47 PFEN-DRP--QCVICNNILANESLKPSKLKRHLETQHAELIDKPLEYFQRK---KKDIKL 80 90 100 110 120 130 190 200 210 220 230 pF1KE4 PTPKIVNTD--NESATEASYNVSYHIALSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKI : . . .:.: .:: :.:..: :.: .: .: : :.: .::.. . :. CCDS47 STQFLSCSTAVSEKALLSSYLVAYRVAKEKIANTAAEKIILPACLDMVRTIFDDKSADKL 140 150 160 170 180 190 240 250 260 270 280 290 pF1KE4 DAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDESADVSGLAVLLVFVRYRFN .. ...::. :: .: .: :. ::. :..:::::.:... ..:::.::: .. CCDS47 KTIP-NDNTVSLRICTIAEHLETMLITRLQSGIDFAIQLDESTDIGSCTTLLVYVRYAWQ 200 210 220 230 240 250 300 310 320 330 340 350 pF1KE4 KSIEEDLLLCESLQSNATGEEIFNCINS-FMQKHEIEWEKCVDVCSDASRAVDGKIAEAV .. ::.: .: :. .: .::. .. .. .....:..: . ::.. .. :: .... CCDS47 DDFLEDFLCFLNLTSHLSGLDIFTELERRIVGQYKLNWKNCKGITSDGTATMTGKHSRVI 260 270 280 290 300 310 360 370 380 390 400 410 pF1KE4 T-LIKYVAPESTSSHCLLYRHALAVKIMPTSLKNVLDQAVQIINYIKARPHQSRLLKILC :.. . .. .::...:..:: . .: .: .:: .::...:.::. .::::. .: CCDS47 KKLLEVTNNGAVWNHCFIHREGLASREIPQNLMEVLKNAVKVVNFIKGSSLNSRLLETFC 320 330 340 350 360 370 420 430 440 450 460 470 pF1KE4 EEMGAQHTALLLNTEVRWLSRGKVLVRLFELRRELLVFM-DSAFRLSDCLTNSSWLLRLA :.:..:: :: .:..::::.::.: :..::: :. :. .. .:.. . ...:. .:: CCDS47 SEIGTNHTHLLYHTKIRWLSQGKILSRVYELRNEIHFFLIEKKSHLASIFEDDTWVTKLA 380 390 400 410 420 430 480 490 500 510 520 530 pF1KE4 YLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSLLRKLEFWASSVEEE--NFDCFPTLSDF ::.:::. :::..:..:::: :: ...... . : .: .. . .. :: . . CCDS47 YLTDIFSILNELSLKLQGKNSDVFQHVERIQGFRKTLLLWQVRLKSNRPSYYMFPRFLQH 440 450 460 470 480 490 540 550 560 570 580 pF1KE4 LTE--INSTVDKDICSAIVQHLRGLRATLLKYFPV----TNDNNAWVRNPFTV----TVK . : :: .. :.: :. :: .: :. ..:: : .:.::..::. .. CCDS47 IEENIINENILKEIKLEILLHLTSLSQTFNHFFPEEKFETLRENSWVKDPFAFRHPESII 500 510 520 530 540 550 590 600 610 620 630 640 pF1KE4 PASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLIQEYPSIARRAVRVLLPFATMHL .:: .. . :..:.:. .:... :::. :: .. ...: ..:..: .::::.: : CCDS47 ELNLVPEEENELLQLSSSYTLKNDYETLSLSAFWMKVKEDFPLLSRKSVLLLLPFTTTSL 560 570 580 590 600 610 650 660 670 680 690 pF1KE4 CETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIKRICDKKTQKHCSH :: ::: . ::: :. :. : ::. ::. .:. ... ..... CCDS47 CELGFSILTQLKTKERNGLNCAAVMRVALSSCVPDWNELMNRQAHPS 620 630 640 650 >>CCDS5668.1 FAM200A gene_id:221786|Hs108|chr7 (573 aa) initn: 986 init1: 321 opt: 872 Z-score: 1071.9 bits: 208.5 E(32554): 2.2e-53 Smith-Waterman score: 1146; 35.7% identity (68.9% similar) in 544 aa overlap (169-693:33-573) 140 150 160 170 180 190 pF1KE4 LSNSSLAPSKLRRHLETKHAAYKDKDISFFKQHLDSPENNKPPTPKIVN---TDNESATE ..:... .:. .:.... : :: : CCDS56 PESRDTTDLSPGGTQEMEGIVIVKVEEEDEEDHFQKERNKVESSPQVLSRSTTMNERALL 10 20 30 40 50 60 200 210 220 230 240 250 pF1KE4 ASYNVSYHIALSGEAHTIGELLIKPCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDL .:: :.:..: ::: .: .: : :.: .::.. . :. .. ::..:..::: . CCDS56 SSYLVAYRVAKEKMAHTAAEKIILPACMDMVRTIFDDKSADKLRTIPLSDNTISRRICTI 70 80 90 100 110 120 260 270 280 290 300 310 pF1KE4 AADIEEELVCRLKICDGFSLQLDESADVSGLAVLLVFVRYRFNKSIEEDLLLCESLQSNA : .: :. ::. :..:::::.:... .:::.::: .. .. :::: : .:.:. CCDS56 AKHLEAMLITRLQSGIDFAIQLDESTDIASCPTLLVYVRYVWQDDFVEDLLCCLNLNSHI 130 140 150 160 170 180 320 330 340 350 360 370 pF1KE4 TGEEIFNCI-NSFMQKHEIEWEKCVDVCSDASRAVDGKIAEAVT-LIKYVAPESTSSHCL :: ..:. . : .. .....:..: . ::.. . :: .. . :.. . ... .::. CCDS56 TGLDLFTELENCLLGQYKLNWKHCKGISSDGTANMTGKHSRLTEKLLEATHNNAVWNHCF 190 200 210 220 230 240 380 390 400 410 420 430 pF1KE4 LYRHALAVKIMPTSLKNVLDQAVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVR ..:.::. : . :: .:: .::. .:.::. .::::.:.: :.:..:: ::..:::: CCDS56 IHREALVSKEISPSLMDVLKNAVKTVNFIKGSSLNSRLLEIFCSEIGVNHTHLLFHTEVR 250 260 270 280 290 300 440 450 460 470 480 490 pF1KE4 WLSRGKVLVRLFELRRELLVFM-DSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQ :::.:::: :..::: :. .:. .. .:.. . .. :. .::::.::: :::..:.:: CCDS56 WLSQGKVLSRVYELRNEIYIFLVEKQSHLANIFEDDIWVTKLAYLSDIFGILNELSLKMQ 310 320 330 340 350 360 500 510 520 530 540 pF1KE4 GKNVTVFTVFDKMSSLLRKLEFWASSVEEE--NFDCFPTLSDFLTE--INSTVDKDICSA ::: .: .... .. . : .: . .. . .. :::: . . : :: :.: CCDS56 GKNNDIFQYLEHILGFQKTLLLWQARLKSNRPSYYMFPTLLQHIEENIINEDCLKEIKLE 370 380 390 400 410 420 550 560 570 580 590 pF1KE4 IVQHLRGLRATLLKYFPVTN----DNNAWVRNPFTVTVKPASLVARDYES-----LIDLT :. :: .: :. ::: . .: :...::. .: :.. . : :..:. CCDS56 ILLHLTSLSQTFNYYFPEEKFESLKENIWMKDPFAFQ-NPESIIELNLEPEEENELLQLS 430 440 450 460 470 480 600 610 620 630 640 650 pF1KE4 SDSQVKQNFSELSLNDFWSSLIQEYPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYR :. .:. .. :::. :: .. ...: ..:... .::::.: .::: ::: . ::: : CCDS56 SSFTLKNYYKILSLSAFWIKIKDDFPLLSRKSILLLLPFTTTYLCELGFSILTRLKTKKR 490 500 510 520 530 540 660 670 680 690 pF1KE4 KRLDAAPHMRIRLSNITPNIKRICDKKTQKHCSH .::..:: ::. ::. .:. :.. .. : : :: CCDS56 NRLNSAPDMRVALSSCVPDWKELMNR--QAHPSH 550 560 570 >>CCDS5576.1 GTF2IRD2 gene_id:84163|Hs108|chr7 (949 aa) initn: 378 init1: 268 opt: 549 Z-score: 669.3 bits: 134.8 E(32554): 5.8e-31 Smith-Waterman score: 549; 27.1% identity (62.1% similar) in 420 aa overlap (252-662:526-936) 230 240 250 260 270 280 pF1KE4 AKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDESA ..:::... :.: ... ..:. .:: . CCDS55 YLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEIT 500 510 520 530 540 550 290 300 310 320 330 340 pF1KE4 DVSGLAVLLVFVR-YRFNKSIEEDLLLCESLQSNATGEEIFNCINSFMQKHEIEWEKCVD :... . : .:.: : .. :.:: . .. .:.:::. ... ... :.: : :. CCDS55 DINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFSRVEKSLKNFCIDWSKLVS 560 570 580 590 600 610 350 360 370 380 390 pF1KE4 VCSDASRA-VDGKIAEAVTLIKYVAP-----ESTSSHCLLYRHALAVKIMPTSLKNVLDQ : : .. : ::.. . .. : . :: : : :... ..: .. . .. .:.: CCDS55 VASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKL--KMDHVMDV 620 630 640 650 660 670 400 410 420 430 440 450 pF1KE4 AVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRLFELRRELLVF .:. .:.: .: . . : :. .:. .:: ::..::::: :: :.:: .:. : CCDS55 VVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVLKRFFESLEEIDSF 680 690 700 710 720 730 460 470 480 490 500 510 pF1KE4 MDSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSLLRKLEF :.: . :.. .:. ::.:.:. .:: .:.:.::.. : ..: . ..: :: . CCDS55 MSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQMYDLIRAFLAKLCL 740 750 760 770 780 790 520 530 540 550 560 570 pF1KE4 WASSVEEENFDCFPTLSDFLTEINSTVDKDICSAI--VQHLRGLRATLLKYFPVTNDNNA : . . ..:. :::: .. : ..: . : . .:. :. : . ... . CCDS55 WETHLTRNNLAHFPTL-----KLASRNESDGLNYIPKIAELQTEFQKRLSDFKLYESELT 800 810 820 830 840 580 590 600 610 620 630 pF1KE4 WVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLIQEYPSIARRAV .::.. . :. . .::: .. .: ....... .:.. : ::. .. . CCDS55 LFSSPFSTKID--SVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPKYKHHCA 850 860 870 880 890 900 640 650 660 670 680 690 pF1KE4 RVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIKRICDKKTQKHCS ..: :.. ..:: :: . .:::: ..: CCDS55 KILSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT 910 920 930 940 >>CCDS34659.1 GTF2IRD2B gene_id:389524|Hs108|chr7 (949 aa) initn: 378 init1: 268 opt: 545 Z-score: 664.4 bits: 133.8 E(32554): 1.1e-30 Smith-Waterman score: 545; 27.3% identity (62.0% similar) in 418 aa overlap (252-662:526-936) 230 240 250 260 270 280 pF1KE4 AKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDESA ..:::... :.: ... ..:. .:: . CCDS34 YLLGSSDTECPEQKQVFANPSPTQKSPVQPVEDLAGNLWEKLREKIRSFVAYSIAIDEIT 500 510 520 530 540 550 290 300 310 320 330 340 pF1KE4 DVSGLAVLLVFVR-YRFNKSIEEDLLLCESLQSNATGEEIFNCINSFMQKHEIEWEKCVD :... . : .:.: : .. :.:: . .. .:.::: ... ..: :.: . :. CCDS34 DINNTTQLAIFIRGVDENFDVSEELLDTVPMTGTKSGNEIFLRVEKSLKKFCINWSRLVS 560 570 580 590 600 610 350 360 370 380 390 pF1KE4 VCSDASRA-VDGKIAEAVTLIKYVAP-----ESTSSHCLLYRHALAVKIMPTSLKNVLDQ : : .. : ::.. . .. : . :: : : :... ..: .. . .. .:.: CCDS34 VASTGTPAMVDANNGLVTKLKSRVATFCKGAELKSICCIIHPESLCAQKL--KMDHVMDV 620 630 640 650 660 670 400 410 420 430 440 450 pF1KE4 AVQIINYIKARPHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRLFELRRELLVF .:. .:.: .: . . : :. .:. .:: ::..::::: :: :.:: .:. : CCDS34 VVKSVNWICSRGLNHSEFTTLLYELDSQYGSLLYYTEIKWLSRGLVLKRFFESLEEIDSF 680 690 700 710 720 730 460 470 480 490 500 510 pF1KE4 MDSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSLLRKLEF :.: . :.. .:. ::.:.:. .:: .:.:.::.. : ..: . ..: :: . CCDS34 MSSRGKPLPQLSSIDWIRDLAFLVDMTMHLNALNISLQGHSQIVTQMYDLIRAFLAKLCL 740 750 760 770 780 790 520 530 540 550 560 570 pF1KE4 WASSVEEENFDCFPTLSDFLTEINSTVDKDICSAIVQHLRGLRATLLKYFPVTNDNNAWV : . . ..:. ::::. :. : . . :.. :. :. : . ... . CCDS34 WETHLTRNNLAHFPTLK--LVSRNESDGLNYIPKIAE-LKTEFQKRLSDFKLYESELTLF 800 810 820 830 840 850 580 590 600 610 620 630 pF1KE4 RNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLIQEYPSIARRAVRV .::.. . :. . .::: .. .: ....... .:.. : ::. .. ... CCDS34 SSPFSTKID--SVHEELQMEVIDLQCNTVLKTKYDKVGIPEFYKYLWGSYPKYKHHCAKI 860 870 880 890 900 640 650 660 670 680 690 pF1KE4 LLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIKRICDKKTQKHCSH : :.. ..:: :: . .:::: ..: CCDS34 LSMFGSTYICEQLFSIMKLSKTKYCSQLKDSQWDSVLHIAT 910 920 930 940 >>CCDS46790.1 EPM2AIP1 gene_id:9852|Hs108|chr3 (607 aa) initn: 356 init1: 195 opt: 434 Z-score: 531.0 bits: 108.5 E(32554): 3e-23 Smith-Waterman score: 434; 22.8% identity (56.3% similar) in 540 aa overlap (130-650:37-563) 100 110 120 130 140 150 pF1KE4 TFSKKPKRRKYDESYLSFGFTYFGNRDAPHAQCVLCKKILSNSSLAPSKLRRHLETKHAA : :..:.... . .::: :..: CCDS46 RSKMEVDEALVFRPEWTQRYLVVEPPEGDGALCLVCRRLIVATR--ERDVRRHYEAEHE- 10 20 30 40 50 60 160 170 180 190 200 210 pF1KE4 YKDKDISFFKQHLDSPENNKPPTPKIVNTDNESATEASYNVSYHIALSGEAHTIGELLIK : .. .. .. . . : : .: :..:. .. .::.:.. :... . CCDS46 YYERYVADGERAALVERLRQGDLPVASFTPEERAARAGLGLCRLLALKGRGWGEGDFVYQ 70 80 90 100 110 120 220 230 240 250 260 270 pF1KE4 PCAKDVVMRMFDEQYSKKIDAVQLSNSTVARRIKDLAADIEEELVCRLKICDGFSLQLDE : .:..: .. . ...:.:: . . .:: .. .....: : . ..:: ::. CCDS46 -CM-EVLLREVLPEHVSVLQGVDLSPDITRQRILSIDRNLRNQLFNRARDFKAYSLALDD 130 140 150 160 170 180 280 290 300 310 320 330 pF1KE4 SADVSGLAVLLVFVRYRFNK-SIEEDLLLCESLQSNATGEEIFNCINSFMQKHEIEWEKC .: :. ::::.: . ..:::: .: . . ... : .: . .. CCDS46 QAFVAYENYLLVFIRGVGPELEVQEDLLTIINLTHHFSVGALMSAILESLQTAGLSLQRM 190 200 210 220 230 240 340 350 360 370 380 390 pF1KE4 VDVCSDASRAVDGKIAEAVTLIKYVAPESTSSHC---LLYRHALAVKIMPT---SLKNVL : . . . . :.: :..:. ...: .: . : : .... . ...... CCDS46 VGLTTTHTLRM---IGENSGLVSYMREKAVSPNCWNVIHYSGFLHLELLSSYDVDVNQII 250 260 270 280 290 400 410 420 430 440 pF1KE4 DQAVQIINYIKAR----PHQSRLLKILCEEMGAQHTALLLNTEVRWLSRGKVLVRLFELR . . : ::.: :. . :: : : . .. ::. :: :::.: .: :: CCDS46 NTISEWIVLIKTRGVRRPEFQTLLTESESEHGERVNGRCLNN---WLRRGKTLKLIFSLR 300 310 320 330 340 350 450 460 470 480 490 500 pF1KE4 RELLVFMDSAFRLSDCLTNSSWLLRLAYLADIFTKLNEVNLSMQGKNVTVFTVFDKMSSL .:. .:. :. . .....:: ...:.::. .: :.. .. ..: . ..::.. .. CCDS46 KEMEAFLVSVGATTVHFSDKQWLCDFGFLVDIMEHLRELSEELRVSKVFAAAAFDHICTF 360 370 380 390 400 410 510 520 530 540 550 560 pF1KE4 LRKLEFWASSVEEENFDCFPTLSDFLTEINST-------VDKDICSAIVQHLRGLRATLL ::... .::.:. ::.: . . :... : : . .. .:. . CCDS46 EVKLNLFQRHIEEKNLTDFPALREVVDELKQQNKEDEKIFDPDRYQMVICRLQKEFERHF 420 430 440 450 460 470 570 580 590 600 610 620 pF1KE4 KYFPVTNDNNAWVRNPFTVTVKPASLVARDYESLIDLTSDSQVKQNFSELSLNDFWSSLI : . . . :::. . : . .: : : ..... ... .:..:...: CCDS46 KDLRFIKKDLELFSNPFNFKPEYAPISVR--VELTKLQANTNLWNEYRIKDLGQFYAGLS 480 490 500 510 520 530 630 640 650 660 670 680 pF1KE4 QE-YPSIARRAVRVLLPFATMHLCETGFSYYAATKTKYRKRLDAAPHMRIRLSNITPNIK : :: : : .: : . ..:: .::: CCDS46 AESYPIIKGVACKVASLFDSNQICEKAFSYLTRNQHTLSQPLTDEHLQALFRVATTEMEP 540 550 560 570 580 590 693 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 04:08:22 2016 done: Sun Nov 6 04:08:23 2016 Total Scan time: 3.360 Total Display time: 0.140 Function used was FASTA [36.3.4 Apr, 2011]