FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5066, 968 aa 1>>>pF1KE5066 968 - 968 aa - 968 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0323+/-0.00113; mu= 17.2558+/- 0.068 mean_var=70.7006+/-14.097, 0's: 0 Z-trim(101.6): 28 B-trim: 6 in 1/48 Lambda= 0.152533 statistics sampled from 6580 (6587) to 6580 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.562), E-opt: 0.2 (0.202), width: 16 Scan time: 3.480 The best scores are: opt bits E(32554) CCDS32474.1 AARS gene_id:16|Hs108|chr16 ( 968) 6361 1409.8 0 CCDS34464.1 AARS2 gene_id:57505|Hs108|chr6 ( 985) 2777 621.2 3.2e-177 >>CCDS32474.1 AARS gene_id:16|Hs108|chr16 (968 aa) initn: 6361 init1: 6361 opt: 6361 Z-score: 7557.7 bits: 1409.8 E(32554): 0 Smith-Waterman score: 6361; 100.0% identity (100.0% similar) in 968 aa overlap (1-968:1-968) 10 20 30 40 50 60 pF1KE5 MDSTLTASEIRQRFIDFFKRNEHTYVHSSATIPLDDPTLLFANAGMNQFKPIFLNTIDPS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 MDSTLTASEIRQRFIDFFKRNEHTYVHSSATIPLDDPTLLFANAGMNQFKPIFLNTIDPS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 HPMAKLSRAANTQKCIRAGGKHNDLDDVGKDVYHHTFFEMLGSWSFGDYFKELACKMALE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 HPMAKLSRAANTQKCIRAGGKHNDLDDVGKDVYHHTFFEMLGSWSFGDYFKELACKMALE 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 LLTQEFGIPIERLYVTYFGGDEAAGLEADLECKQIWQNLGLDDTKILPGNMKDNFWEMGD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 LLTQEFGIPIERLYVTYFGGDEAAGLEADLECKQIWQNLGLDDTKILPGNMKDNFWEMGD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 TGPCGPCSEIHYDRIGGRDAAHLVNQDDPNVLEIWNLVFIQYNREADGILKPLPKKSIDT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 TGPCGPCSEIHYDRIGGRDAAHLVNQDDPNVLEIWNLVFIQYNREADGILKPLPKKSIDT 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 GMGLERLVSVLQNKMSNYDTDLFVPYFEAIQKGTGARPYTGKVGAEDADGIDMAYRVLAD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 GMGLERLVSVLQNKMSNYDTDLFVPYFEAIQKGTGARPYTGKVGAEDADGIDMAYRVLAD 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 HARTITVALADGGRPDNTGRGYVLRRILRRAVRYAHEKLNASRGFFATLVDVVVQSLGDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 HARTITVALADGGRPDNTGRGYVLRRILRRAVRYAHEKLNASRGFFATLVDVVVQSLGDA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 FPELKKDPDMVKDIINEEEVQFLKTLSRGRRILDRKIQSLGDSKTIPGDTAWLLYDTYGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 FPELKKDPDMVKDIINEEEVQFLKTLSRGRRILDRKIQSLGDSKTIPGDTAWLLYDTYGF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 PVDLTGLIAEEKGLVVDMDGFEEERKLAQLKSQGKGAGGEDLIMLDIYAIEELRARGLEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 PVDLTGLIAEEKGLVVDMDGFEEERKLAQLKSQGKGAGGEDLIMLDIYAIEELRARGLEV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 TDDSPKYNYHLDSSGSYVFENTVATVMALRREKMFVEEVSTGQECGVVLDKTCFYAEQGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 TDDSPKYNYHLDSSGSYVFENTVATVMALRREKMFVEEVSTGQECGVVLDKTCFYAEQGG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE5 QIYDEGYLVKVDDSSEDKTEFTVKNAQVRGGYVLHIGTIYGDLKVGDQVWLFIDEPRRRP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 QIYDEGYLVKVDDSSEDKTEFTVKNAQVRGGYVLHIGTIYGDLKVGDQVWLFIDEPRRRP 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE5 IMSNHTATHILNFALRSVLGEADQKGSLVAPDRLRFDFTAKGAMSTQQIKKAEEIANEMI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 IMSNHTATHILNFALRSVLGEADQKGSLVAPDRLRFDFTAKGAMSTQQIKKAEEIANEMI 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE5 EAAKAVYTQDCPLAAAKAIQGLRAVFDETYPDPVRVVSIGVPVSELLDDPSGPAGSLTSV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EAAKAVYTQDCPLAAAKAIQGLRAVFDETYPDPVRVVSIGVPVSELLDDPSGPAGSLTSV 670 680 690 700 710 720 730 740 750 760 770 780 pF1KE5 EFCGGTHLRNSSHAGAFVIVTEEAIAKGIRRIVAVTGAEAQKALRKAESLKKCLSVMEAK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 EFCGGTHLRNSSHAGAFVIVTEEAIAKGIRRIVAVTGAEAQKALRKAESLKKCLSVMEAK 730 740 750 760 770 780 790 800 810 820 830 840 pF1KE5 VKAQTAPNKDVQREIADLGEALATAVIPQWQKDELRETLKSLKKVMDDLDRASKADVQKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VKAQTAPNKDVQREIADLGEALATAVIPQWQKDELRETLKSLKKVMDDLDRASKADVQKR 790 800 810 820 830 840 850 860 870 880 890 900 pF1KE5 VLEKTKQFIDSNPNQPLVILEMESGASAKALNEALKLFKMHSPQTSAMLFTVDNEAGKIT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 VLEKTKQFIDSNPNQPLVILEMESGASAKALNEALKLFKMHSPQTSAMLFTVDNEAGKIT 850 860 870 880 890 900 910 920 930 940 950 960 pF1KE5 CLCQVPQNAANRGLKASEWVQQVSGLMDGKGGGKDVSAQATGKNVGCLQEALQLATSFAQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS32 CLCQVPQNAANRGLKASEWVQQVSGLMDGKGGGKDVSAQATGKNVGCLQEALQLATSFAQ 910 920 930 940 950 960 pF1KE5 LRLGDVKN :::::::: CCDS32 LRLGDVKN >>CCDS34464.1 AARS2 gene_id:57505|Hs108|chr6 (985 aa) initn: 1952 init1: 783 opt: 2777 Z-score: 3295.2 bits: 621.2 E(32554): 3.2e-177 Smith-Waterman score: 2777; 45.8% identity (72.3% similar) in 970 aa overlap (7-963:39-985) 10 20 30 pF1KE5 MDSTLTASEIRQRFIDFFK-RNEHTYVHSSATIPLD :: .: :..::. :. : : :... : CCDS34 ARRLRRAIRRSPAWRGLSHRPLSSEPPAAKASAVRAAFLNFFRDRHGHRLVPSASVRPRG 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE5 DPTLLFANAGMNQFKPIFLNTIDPSHPMAKLSRAANTQKCIRAGGKHNDLDDVGKDVYHH ::.:::.::::::::::::.:.:: :: . :.::.:::.::::.::::.:::.:. :: CCDS34 DPSLLFVNAGMNQFKPIFLGTVDPRSEMAGFRRVANSQKCVRAGGHHNDLEDVGRDLSHH 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE5 TFFEMLGSWSFG-DYFKELACKMALELLTQEFGIPIERLYVTYFGGDEAAGLEADLECKQ :::::::.:.:: .:::: ::.:: ::::: .::: :::...:: :: :::. ::: .. CCDS34 TFFEMLGNWAFGGEYFKEEACNMAWELLTQVYGIPEERLWISYFDGDPKAGLDPDLETRD 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE5 IWQNLGLDDTKILPGNMKDNFWEMGDTGPCGPCSEIHYDRIGGRDAAHLVNQDDPNVLEI :: .::. ...: . ..::::::::::::::.::::: :: : :...:. CCDS34 IWLSLGVPASRVLSFGPQENFWEMGDTGPCGPCTEIHYDLAGGVGA--------PQLVEL 190 200 210 220 230 240 220 230 240 250 260 270 pF1KE5 WNLVFIQYNREADGILKPLPKKSIDTGMGLERLVSVLQNKMSNYDTDLFVPYFEAIQKGT :::::.:.:::::: :.:::.. .::::::::::.:::.: :.:::::: : ..:::.: CCDS34 WNLVFMQHNREADGSLQPLPQRHVDTGMGLERLVAVLQGKHSTYDTDLFSPLLNAIQQGC 250 260 270 280 290 300 280 290 300 310 320 330 pF1KE5 GARPYTGKVGAEDADGIDMAYRVLADHARTITVALADGGRPDNTGRGYVLRRILRRAVRY : :: :.::. : : ::::.::: ::..: ..:: : .: :::::::::::. CCDS34 RAPPYLGRVGVADEGRTDTAYRVVADHIRTLSVCISDGIFPGMSGPPLVLRRILRRAVRF 310 320 330 340 350 360 340 350 360 370 380 390 pF1KE5 AHEKLNASRGFFATLVDVVVQSLGDAFPELKKDPDMVKDIINEEEVQFLKTLSRGRRILD . : :.: ::...:: :::..::::.:::... .. ....:.:. :: .: :::::.: CCDS34 SMEILKAPPGFLGSLVPVVVETLGDAYPELQRNSAQIANLVSEDEAAFLASLERGRRIID 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE5 RKIQSLGDSKTIPGDTAWLLY--DTYGFPVDLTGLIAEEKGLVVDMDGFEEERKLAQLKS : ...:: : .:...:: : :.:.:.. :. ::::. .: :.: .::: .. CCDS34 RTLRTLGPSDMFPAEVAWSLSLCGDLGLPLDMVELMLEEKGVQLDSAGLE---RLAQEEA 430 440 450 460 470 460 470 480 490 500 pF1KE5 QGKGAGGEDL----IMLDIYAIEELRARGLEVTDDSPKYNYHLDSSGSYVFENTVATVMA : .. .: . . ::..:. ::. .:. ::::::::: : :::: : . : :. CCDS34 QHRARQAEPVQKQGLWLDVHALGELQRQGVPPTDDSPKYNYSLRPSGSYEFGTCEAQVLQ 480 490 500 510 520 530 510 520 530 540 550 560 pF1KE5 LRREK-MFVEEVSTGQECGVVLDKTCFYAEQGGQIYDEGYLVKVDDSSEDKTEFTVKNAQ : : : :. ::.::..::.: :::::::: :.::::. .... . : : :: CCDS34 LYTEDGTAVASVGKGQRCGLLLDRTNFYAEQGGQASDRGYLVR---AGQEDVLFPVARAQ 540 550 560 570 580 590 570 580 590 600 610 620 pF1KE5 VRGGYVLHIGTIYGDLKVGDQVWLFIDEPRRRPIMSNHTATHILNFALRSVLGEA-DQKG : ::..:: .. :..:::: : .:: : :..:::::.::.:::..:: . .:.: CCDS34 VCGGFILHEAVAPECLRLGDQVQLHVDEAWRLGCMAKHTATHLLNWALRQTLGPGTEQQG 600 610 620 630 640 650 630 640 650 660 670 680 pF1KE5 SLVAPDRLRFDFTAKGAMSTQQIKKAEEIANEMIEAAKAVYTQDCPLAAAKAIQGLRAVF : . :..::.: :.. .. .:.. .:. ..: . .::: .. ::: . . :::.. CCDS34 SHLNPEQLRLDVTTQTPLTPEQLRAVENTVQEAVGQDEAVYMEEVPLALTAQVPGLRSL- 660 670 680 690 700 710 690 700 710 720 730 740 pF1KE5 DETYPDPVRVVSIGVPVSELLDDPSGPAGSLTSVEFCGGTHLRNSSHAGAFVIVTEEAIA ::.:::::::::.::::.. :: :.. :. ::::.: :::: .. .: .::. .. .. CCDS34 DEVYPDPVRVVSVGVPVAHALD-PASQAALQTSVELCCGTHLLRTGAVGDLVIIGDRQLS 720 730 740 750 760 770 750 760 770 780 790 800 pF1KE5 KGIRRIVAVTGAEAQKALRKAESLKKCLSVMEAKVKAQTAPNKDVQREIADLG---EALA :: :..:::: .::.: . ..:: . ... ... . .. : :.: ::. CCDS34 KGTTRLLAVTGEQAQQARELGQSLAQEVKAATERLSLGSRDVAEALRLSKDIGRLIEAVE 780 790 800 810 820 830 810 820 830 840 850 860 pF1KE5 TAVIPQWQKDELRETLKSLKKVMDDLDRASKADVQKRVLEKTKQFIDSNPNQPLVILEME :::.::::. :: :.: :.. . : . .. .::..... . . ::.. . CCDS34 TAVMPQWQRRELLATVKMLQRRANTAIRKLQMG---QAAKKTQELLERHSKGPLIV-DTV 840 850 860 870 880 870 880 890 900 910 920 pF1KE5 SGASAKALNEALKLFKMHSPQTSAMLFTVDNEAGKITCLCQVPQNAANRGLKASEWVQQV :. : ..: .... . ..:.::..:.. . ::. : ::: :.: . : :. : CCDS34 SAESLSVLVKVVRQLCEQAPSTSVLLLS-PQPMGKVLCACQVAQGAMPT-FTAEAWALAV 890 900 910 920 930 940 930 940 950 960 pF1KE5 SGLMDGKGGGKDVSAQATGKNVGCLQEALQLATSFAQLRLGDVKN . : ::. :. : ::.::... :. ::..: ..: .: CCDS34 CSHMGGKAWGSRVVAQGTGSTTD-LEAALSIAQTYALSQL 950 960 970 980 968 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 04:42:32 2016 done: Tue Nov 8 04:42:33 2016 Total Scan time: 3.480 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]